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PRÉFACE 


L'histoire des mathématiques abonde en exemples où la variante 
discrète d’une théorie a fait son apparition avant la variante con- 
tinue, préparant ainsi les voies de développement de cette dernière. 
Pour la théorie de commande optimale les choses se sont passées 
autrement. Les voies de développement de la théorie ont été posées 
par la théorie continue de commande optimale, élaborée pendant 
les derniers 15 à 20 ans. Son résultat central est le principe du maxi- 
mum de L. Pontriaguine. La grande importance et la popularité 
de ce résultat amenèrent les chercheurs à entreprendre en premier 
lieu, dans les problèmes discrets de l’optimisation (qui ont suscité 
un peu plus tard un large intérêt), l’élaboration d’un analogue dis- 
cret du principe du maximum. 

Parmi les nombreux travaux consacrés à cette question, un cer- 
tain nombre fut erroné. II suffit de dire que le livre de Fan et Wang, 
The Discrete Maximum Principle (New York, 1964) n’est pas correct 
mathématiquement. Ainsi, la naissance de la variante discrète de la 
théorie de commande optimale fut empreinte de certaines difficul- 
tés. 

Parmi les travaux dont la publication amena à la création de la 
théorie des processus optimaux discrets, il faut noter les articles 
des savants soviétiques (N. Krassovski, L. Rozonoer, F. Kirillova, 
R. Gabassov, A. Boutkovski, A. Propoy, etc.) et des auteurs étran- 
gers (S. S. L. Chang, R. Bellman, E. S. Lee, H. Halkin, J. M. Holtz- 
man, B. W. Jordan, E. Polak, Fam Hyou Chak, etc.). 

Outre les articles des auteurs cités ci-dessus, il faut mentionner 
le petit livre, bien écrit, de B. Pchénitchny, Conditions nécessaires 
d'extremum (Editions « Naouka », 1969). Il contient, en particulier, 
un bref exposé de quelques théorèmes, réunis sous le titre de « prin- 
cipe discret du maximum ». Enfin, il existe toute une série de livres 
et d'articles qui se rapportent spécialement à la méthode de pro- 
grammation dynamique, développée par le mathématicien améri- 
cain R. Bellman et tout à fait différente du principe discret du 
maximum. Voilà, en fin de compte, à peu près tout ce qui a été 
publié sur la théorie de commande optimale discrète. 
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Ainsi, le livre proposé à l'attention du lecteur est une première 
tentative d'exposer de façon systématique la théorie de commande 
optimale discrète. Le livre est écrit dans une optique entièrement 
mathématique; on n’y considère pas les applications. Mais même 
en ce qui concerne la théorie mathématique des processus optimaux 
discrets, le livre ne prétend pas être exhaustif. Par exemple, on n’y 
aborde aucunement les processus discrets à nombre d’itérations 
infini, les questions d’approximation des processus optimaux con- 
tinus par les processus discrets, les méthodes numériques dans les 
problèmes de commande discrète. Certaines de ces questions sont 
traitées dans le livre de N. Moïsséev, Méthodes numériques de la 
théorie des systèmes optimaux (Editions « Naouka », 1971). 

Quelques mots sur les méthodes qui servent de fondement dans 
le présent ouvrage. Il y en a deux. La première est liée aux problè- 
mes de séparation des systèmes de cônes convexes. Elle fut pro- 
posée dans les travaux de A. Milioutine et A. Doubovitski. Dans 
le livre, cette méthode est exposée sous une forme beaucoup plus 
générale (n° 32). Notre exposition diffère de la méthode de Miliou- 
tine-Doubovitski, qui supposaient que tous les cônes, sauf un, sont 
solides, tandis que nous considérons le cas général. 

La deuxième méthode employée dans ce livre (n° 35) est liée 
aux notions de topologie (plus précisément, à la théorie des inter- 
sections, qui remonte aux travaux du mathématicien américain 
S. Lefschetz). Il faut faire la remarque suivante au sujet de cette 
méthode. Dans la préface du livre cité ci-dessus, B. Pchénitchny 
qualifia la première démonstration du principe du maximum de 
« sensationnelle dans une certaine mesure ». Il me semble que la 
démonstration apparaît insolite à cause des idées topologiques que 
l’on y emploie, idées que la majorité des spécialistes en mathémati- 
ques appliquées considère toujours avec circonspection. J'ai essayé 
de montrer ici que les méthodes topologiques sont très utiles dans la 
théorie de commande mathématique et permettent d'obtenir des 
résultats plus profonds et plus délicats. Néanmoins, le lecteur auquel 
les considérations topologiques seraient étrangères, trouvera des 
indications qui lui permettront de rester dans le cadre des méthodes 
d'analyse classiques. 

Le livre contient cinq chapitres. Le chapitre I contient les don- 
nées préliminaires sur le problème de la commande optimale des 
objets discrets. Pour un certain groupe de lecteurs ces données seront 
entièrement suffisantes. On y trouvera la position du problème, 
une discussion (très approximative) des méthodes de solution pos- 
sibles, une première formulation des résultats et une comparaison 
non approfondie de la théorie de la commande optimale discrète 
avec d’autres théories « extrémales » en mathématiques. 

Au fond, ce chapitre peut être considéré comme un livre à part, 
de petit volume, adressé au lecteur-ingénieur, qui voudrait aborder 
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le sujet. On peut espérer qu’une fois habitué à la formulation mathé- 
matique du problème et à la forme des énoncés (en particulier, ré- 
concilié à la présence de variables auxiliaires dans les théorèmes), 
le lecteur-ingénieur considérera le dernier chapitre du livre comme 
onvrage de référence, à l'emploi duquel il est psychologiquement pré- 
paré. Pour une étude plus approfondie du sujet, le lecteur s’adres- 
sera aux chapitres intermédiaires. 

Le chapitre IT contient des faits fondamentaux ayant trait à la 
théorie des espaces vectoriels de dimension finie et à la géométrie 
affine et euclidienne. L’exposition de ces questions contenue dans 
les cours d’algèbre linéaire est algébrique et n’aborde pas, en règle 
générale, les notions géométriques. [1 en résulte que, souvent, les 
ingénieurs sont incapables, par exemple, d'expliquer l'écriture de 
l'équation d’un hyperplan, ou, dans le meilleur des cas, l’écrivent 
par analogie avec les équations connues du cours de géométrie ana- 
lytique de l’espace tridimensionnel. 

Ce chapitre contient un exposé complet de la géométrie eucli- 
dienne (multidimensionnelle) sur la base des axiomes de Weyl. 
C'est aussi, en fait, un petit livre séparé. Le lecteur (s’il ne désire 
pas se mettre à l’étude approfondie de la géométrie, ou s’il se croit 
capable de comprendre le sujet dans ses grandes lignes) peut se servir 
de ce livre comme d’un aide-mémoire pour l’étude des chapitres 
ultérieurs, où l’on utilise les notions de géométrie. 

Le chapitre III contient les renseignements nécessaires qui se 
‘apportent à la théorie des ensembles convexes, exposés avec démons- 
trations complètes. La théorie des corps convexes est largement 
appliquée aux problèmes de commande optimale (y compris dans 
le cas discret); dominer les notions et les faits de cette théorie est 
non seulement un impératif de la culture d’un mathématicien, mais 
aussi de celle d’un ingénieur. La fin du chapitre expose les théorè- 
mes de séparation des cônes convexes, généralisant la méthode 
de Milioutine-Doubovitski. 

Ce chapitre forme également un tout. Le lecteur-ingénieur qui 
ne veut pas entrer dans les détails des démonstrations mathématiques, 
peut également considérer ce chapitre comme matériel de référence. 

Ensemble, les chapitres IT et III contiennent tous les renseigne- 
ments géométriques nécessaires. 

Le chapitre IV est également tout à fait autonome. Il se rap- 
porte surtout aux questions de programmation mathématique. On 
y expose les résultats du genre du théorème de Kuhn-Tucker; il y a 
probablement des résultats nouveaux parmi eux. Dans le livre, le 
chapitre IV sert de fondement à l’élaboration (effectuée au chapitre 
suivant) de la théorie de la commande optimale discrète. 

Le chapitre V, qui est consacré aux critères d’optimalité de la 
commande discrète est, par son contenu, le chapitre central de l’ou- 
vrage. Les conditions d’optimalité nécessaires et suffisantes y sont. 


40 PRÉFACE 


exposées, dans la mesure du possible, sous la forme la plus géné- 
rale. On y trouvera, en outre, une nouvelle variante du principe 
discret du maximum, obtenue à l’aide de la « méthode des sections 
locales », déjà appliquée par l’auteur à la théorie de la commande 
optimale continue. 

II faut remarquer que les problèmes à retard (une méthode pour 
les réduire aux problèmes sans retard est ébauchée au chapitre I) 
ne sont pas considérés ici en détail. Les critères d’optimalité cor- 
respondants peuvent être trouvés dans les travaux de Fam Hyou 
Chak ; on peut également les obtenir à l’aide des méthodes exposées 
dans le présent ouvrage. Les travaux de R. Gabassov et d’autres 
auteurs, contenant les critères d’optimalité non pas d'ordre 1, mais 
d’ordre supérieur, et leur application à la recherche des processus op- 
timaux singuliers (dégénérés) se trouvent également en dehors du 
cadre du cinquième chapitre. 

Ainsi se conçoit cet ouvrage: cinq petits livres séparés, formant 
ensemble un tout. Il revient au lecteur de juger dans quelle mesure 
cette conception a été réussie. 

En conclusion, je voudrais exprimer ma reconnaissance à tous 
mes collègues et amis qui, par leur attention, leurs remarques et 
leurs conseils, ont aidé à la publication de ce livre. Parmi eux il 
faut nommer en premier lieu mon maître L. Pontriaguine, N. Kras- 
sovski, B. Pétrov, E. Michtchenko, N. Rozov, R. Moukourdoumov. 


V. Boltianski 


CHAPITRE I 


ÉNONCÉ DU PROBLÈME ET CARACTÈRE 
DES RÉSULTATS 


$ 1. Problème d'optimisation des processus 
discrets 


1. Problème du maximum d’un produit. Dans cette section et 
dans la section suivante, nous poserons plusieurs problèmes. Malgré 
leur caractère totalement différent, ils nous amèneront, leur signi- 
fication mathématique une fois comprise, à des problèmes mathé- 
matiques analogues: des problèmes de commande optimale de sys- 
tèmes discrets. 

Exemple 1.1. Considérons le problème bien connu suivant: 
trouver N nombres non négatifs dont la somme ne dépasse pas un nombre 
donné a > 0 et dont le produit est en même temps maximal. 

Nous n’allons pas résoudre maintenant ce problème, nous limi- 
tant à le formuler d’une autre façon. Pour cela, procédons à l’expé- 
rience imaginaire suivante. Quelqu'un cherche à choisir N nombres 
non négatifs, dont la somme est inférieure ou égale à a, et ensuite, 
en les multipliant, à voir dans quelle mesure le produit obtenu a 
augmenté. Pour ce faire, à la première seconde, il choisit un nombre 
non négatif (bien entendu, inférieur ou égal à a), à la deuxième 
seconde, encore un nombre (de manière que la somme des deux nom- 
bres choisis soit inférieure ou égale à a), à la troisième, un troisième 
nombre, ...; enfin, il choisit le V-ième nombre à la V-ième se- 
conde. Désignons le nombre que choisit ce quelqu'un au moment # 
par u (t). Ainsi, le choix de V nombres, dont la somme est inférieure 
ou égale à a, a été remplacé par le choix d’une certaine fonction 
u (t) qui est définie non pas pour toutes les valeurs de £, mais seu- 
lement pour un ‘ensemble discret de valeurs { = 1, 2, ..., N. 

Il est naturel de supposer qu’en choisissant les nombres suc- 
cessifs w (1), u (2), ..., u (N) notre quelqu'un calcule chaque fois 
la somme et le produit des nombres choisis. La somme lui est néces- 
saire pour savoir dans quelles limites il peut choisir le nombre sui- 
vant (i.e. combien il reste jusqu’à a). Il est commode de savoir cha- 
que fois le produit des nombres choisis pour obtenir, une fois arrivé 
à la fin du processus, le produit de tous les nombres. Ainsi, dési- 
gnons par x! (#) la somme et par x° (t) le produit de tous les nombres 
déjà choisis après { secondes: 

at =u({t)+u()+...+ut(); 
x? (4) = u (ju (2)...u (6). 
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Il est clair, qu'ayant choisi au moment # le nombre w (#), notre quel- 
qu’un ajoutera simplement le nombre w (f) qu’il vient de choisir à 
la somme x! (£ — 1) de tous les nombres obtenus précédemment pour 
calculer la somme de tous les nombres obtenus: 


xt (8) = xl (6 — 1) + u (b). (1.1) 


Exactement de la même manière, pour obtenir x* (4), il faut mul- 
tiplier le produit de tous les nombres choisis auparavant, i.e. 2? (1 — 
— 1) par le nombre w (t) que l’on vient de choisir: 


a? (4) = x? (t — Aj-u (b). (1.2) 


Les formules (1.1) et (1.2) sont vraies pour t — 2, ..., N. Pour 
t — À nous avons à leur place les relations x! (1) — u (1), x? (1) — 
— u (1). Nous pouvons inclure ces deux relations dans le système 
des formules (1.1), (1.2) en convenant que 


x (0) — 0, 2x2 (0) = 1. (1.3) 


Alors les relations (1.1), (1.2) ont lieu pour toutes les valeurs £ — 
te 2 ées iNe 

Déterminons enfin dans quelles limites on peut choisir le nombre 
u (t) au moment {. Puisqu’en ce moment la somme de tous les nom- 
bres choisis doit être inférieure ou égale à a, ï.e. 


xl(t—1)+u( <a, 


nous devons avoir 
u ()<Za—xt(t — 1). 


D'autre part, par hypothèse, le nombre uw (t) doit être non négatif. 
Ainsi, le nombre uw (f) doit appartenir au segment 


OLu(tLa—x'(t — 1), (1.4} 


u (DEU (xt (it — 1)), (1.5) 


où l’on a désigné par U (x! (t — 1)) le segment (1.4). 

Il nous reste à remarquer que le produit de lous les nombres 
choisis u (1), u (2), ..., u (N) est égal à x? (N). Ainsi, l'expérience 
que nous avons imaginée peut être décrite de la manière suivante: 
on choisit les nombres successifs u (1), u (2), . .., u (N) et à chaque 
moment t = 1, 2, ..., N on détermine, en même temps que u (t), les 
nombres x! (t), x? (t) (voir (1.1), (1.2), (1.3)) en imposant la con- 
trainte (1.5), où U (x! (t—1)) est le segment défini par les relations 
(1.4); au moment terminal t — N, on veut connaître la valeur de 
x? (N). 

Convenons de dire que les relations (1.1), (1.2) définissent un 
objet commandé discret, où x', x? sont les coordonnées de phase et u 
le paramètre de commande, qui doit varier dans les limites du domaine 
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de commande, défini par les relations (1.4). Convenons d'appeler 
commande une suite quelconque de nombres u (1), u (2), ..., u (N), 
et les suites 


(O0) D), 4 2 ON) 
LA0)2 (D). ON): 


déterminées à partir des relations (1.1), (1.2) à l’aide des conditions 
initiales (1.3) seront appelées trajectoires correspondant à cette com- 
mande. Si, à chaque moment £ = 1, 2, ...., N, on a la relation 
(1.5), alors la commande uw (1), . .., u (N) sera appelée admissible. 

Il est maintenant clair que le problème du maximum du produit 
peut être reformulé de la manière suivante: pour un objet commandé 
discret (1.1), (1.2) trouver une commande admissible et la trajectoire 
correspondante avec les conditions initiales (1.3) de manière à satisfaire 
à la contrainte (1.5) et à obtenir une valeur maximale pour la quan- 
tité x? (N). 

Exemple 1.2. Considérons une autre méthode de réduction 
du problème du maximum du produit à un objet commandé discret. 
Pour cela, imaginons une autre expérience. Nous supposerons que 
notre quelqu'un (qui figurait dans l’exemple 1.1) ne s'intéresse 
qu'aux cas où tous les facteurs sont positifs (si au moins un 
des facteurs est nul, alors leur produit l’est aussi et ne donne évi- 
demment pas la valeur maximale); et, pour simplifier l'opération 
de multiplication, il calcule non pas le produit lui-même, mais 
son logarithme, i.e. la somme des logarithmes des facteurs. 

Pour ce point de vue, la commande uw (&), t = 1, 2 ..., N, 
et la première coordonnée de phase zx! (#6), & — 0,1, ..., N, ont la 
même signification qu'auparavant; la relation (1.1) et la première 
des égalités (1.3) restent également valables. La deuxième coor- 
donnée de phase et les relations qui s’y rapportent ne sont plus néces- 
saires: à leur place notre quelqu'un, choisissant successivement 


les nombres uw (1), uw (2), ..., u (N), calcule la somme de leurs 
logarithmes et pose le problème de maximisation de cette somme: 
J=inu(t)+inu(2)+...<+inu(N). (1.6) 


(Nous employons ici les logarithmes naturels, i.e. les logarithmes 
de base e.) 

Ensuite nous modifierons les contraintes (1.4) de la manière sui- 
vante. Désignons par M, le segment [0, a] et imposons l'inclusion 


x (N)E M. (1.7) 


Puisque, d’après (1.1), nous avons x! (N) — u (1) + u (2) + ... 
... + u (N), l'inclusion (1.7) signifie que la somme de tous les 
nombres choisis uw (1), u (2), ..., u (N) est inférieure ou égale à a. 
Il ne nous reste donc qu’à exiger que tous ces nombres soient posi- 
tifs, i.e. à remplacer les contraintes (1.4) par les contraintes plus 
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simples : 
LD) = 0, 2 tr se Ne (1.8) 


Ainsi, le domaine de commande U (x! (& — 1)) (cf. (1.5)) est main- 
tenant une demi-droite U — (0, ) et ne dépend donc pas de x! (4 — 
— 1), de sorte que la relation (1.8) est plus simple que la relation 
correspondante (1.5): 


u (D EU. (1.9) 


Ainsi, l’objet commandé discret est maintenant défini par la 
relation (1.1), où x! est la coordonnée de phase (unique) et w est le 
paramètre de commande, qui varie à l’intérieur du domaine de com- 
mande défini par la relation (1.8). Il en résulte que le problème du 
maximum du produit, considéré dans l’exemple précédent, peut 
être formulé de la manière suivante: pour l'objet commandé dis- 
cret (1.1) trouver une commande u (1), u (2), ..., u (N) satisfaisant 
à la condition (1.8) et telle que, pour la trajectoire correspondante x! (0), 
x! (1), ..., zx!(N) avec la condi- 
tion initiale x! (0) = 0, on ait la 
relation (1.7), la somme (1.6) ayant 
alors une valeur maximale. 

2. Quelques applications. E x e m- 
ple 2.1 *), Une ferme d’éle- 
vage possède un troupeau de bo- 
vins. Chaque année une partie est 

Fig. 1 envoyée à l’abattoir, les autres 

restant à la ferme pour reproduc- 

tion. Le revenu de la vente du bétail aux organisations qui gèrent 
les abattoirs est exprimé par une fonction œ (x), où x est la quantité 
de bétail livré (la fonction œ (x) peut être, par exemple, de la forme 
indiquée sur la fig. 1: la viande livrée en excès par rapport au ni- 
veau planifié b est payée à un prix supérieur). La quantité de bétail 
gardé à la ferme pour reproduction augmente deafois (où a>1) pen- 
dant l’année (jusqu’à l'abattage suivant). De quelle manière la 
ferme peut-elle obtenir en V années un revenu maximal si la quan- 
tité minimale de bétail à livrer chaque année est: égale à b? 

Désignons par x! (0) la quantité de bétail qu’il y avait à la ferme 
au début, et par x! (t) la quantité de bétail qui reste à la ferme à ia 
fin de la t-ième année (£ — 1, 2, ..., N). Désignons par u (6), 
t — 1, 2,..., N, la quantité de bétail envoyée aux abattoirs, 
durant la f-ième année. A la (4 — 1)-ième anneé il restait à la ferme 
une quantité de bétail égale à x! (£ — 1). Par conséquent, à la 
t-ième année (avant l’abattage), il y aura à la ferme une quantité de 


D! 


bétail égale à ax! (£ — 1). Une partie égale à u (#) de ce bétail sera 





*) Cf. R. Bellman, Dynamic Programming. Princeton, 1957. 
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envoyée aux abattoirs, et le reste, ï.e. ax! (t — 1) — u (t), sera 
conservé à la fin de la t-ième année pour reproduction. Ainsi, 


d'=atft—1)—u(,i—=1,2,...,N. (2.1) 


Le revenu de la ferme en W ans sera 
N 
T= pu (D) + ++ PV) T eu). C2 
Prenant en considération les livraisons obligatoires, nous avons pour 
le paramètre de commande x les contraintes suivantes : 


uD>b,t=1,2, .., N. (2.3) 


D'autre part, d’après la signification du problème, la coordonnée 
de phase x! (i.e. la quantité de bétail qui reste pour reproduction), 
est non négative: 


z2(D>0,1—1,2,...,N. (2.4) 


Ainsi, le problème du maximum du revenu d’une ferme d’éle- 
vage pour une période de V ans s’énonce de la manière suivante: 
pour l’objet commandé discret (2.1) trouver une commande u (1), 
u (2), ..., u (N), qui satisfait à la condition (2.8), de sorte que pour 
la trajectoire correspondante x! (0), x! (1), ..., x! (N) avec la con- 
dition initiale donnée x! (0) = c soit vérifiée la relation (2.4) et que 
la somme (2.2) prenne la valeur maximale. 

Remarquons que dans l’exemple 2.1, le nombre x! (NW), ïi.e. 
la quantité de bétail qui reste à la ferme vers lafin de la N-ième 
année, n’est aucunement réglementée par les conditions du problème. 
Il est donc évident que pour obtenir un revenu maximal pour la 
période de ans, il est rationnel de livrer à la V-ième année tout 
le bétail disponible, ce qui signifie qu’exactement après N ans la 
ferme cessera d'exister. Si ceci n’est pas en accord avec le plan, il 
faut remplacer la dernière des conditions (2.4) par la relation x! (W) > 
> d, où d est la quantité de bétail que l’on veut avoir à la ferme à 
la fin de la période de À ans. 

Exemple 2.2. On se propose d'établir le projet d’une fusée 
porteuse à V étages avec le poids au lancement G. On connaît 
également le poids A du vaisseau spatial qui doit être envoyé sur 
la trajectoire de vol à l’aide du dernier étage de la fusée porteuse. 
Chaque étage de cette fusée possède une certaine quantité de pro- 
pergol. Pendant le travail de chaque étage (à partir de la mise en 
marche de ses moteurs jusqu’à la séparation de l’étage, une fois le 
propergol entièrement épuisé), la vitesse de la fusée augmente de 
Av qui dépend du poids P porté par cet étage et du poids Q de l’éta- 
ge lui-même (qui définit la quantité de propergol): 


Av = f(P, Q). 
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Il s’agit de trouver la distribution de poids entre les étages pour 
laquelle la vitesse du vaisseau spatial (une fois tous les étages de la 
fusée porteuse séparés) sera maximale *). 

Désignons par uw (f) le poids du t-ième étage, compté à partir 
du vaisseau spatial. Aïnsi, le poids du dernier étage (qui met défi- 
nitivement le vaisseau sur sa trajectoire de vol et se sépare du vais- 

seau après tous les autres élages) 
Vase sera désigné par uw (1), le poids 
de l’avant-dernier étage par u (2), 


PAU etc. Désignons ensuite le ‘poids 
l-er étage total du vaisseau spatial et des t 
étages par x! (), 1 — 0,1, ...,N 
TV) (fig. 2). Alors, il est clair que 


at () = xt (t— 1) +u(t), (2.5) 

bd, 2 ess, 
(Ë-T)-ième #06 la définition du poids du vaisseau 
spatial et du poids au lancement 


, is 4 de la fusée imposant les conditions 
u(e7 “LEUR SEE suivantes : 


2° (0) = ÆH, 2 '(N) = G. 
D'après ce qui a été dit ci-dessus, 


la vitesse supplémentaire commu- 
{ \ niquée pendant le temps de travail 
UN UN du t-ième étage est égale à 


Av, = f(x (t — 1), u (t)), 


car u (4) est le poids du t-ième étage 
et x! (6 — 1) le poids total porté 
par cet étage. La vitesse terminale communiquée au vaisseau spatial 
par tous les étages de la fusée porteuse est égale à 


Fig. 2 


N 
J = 2 f(at(t— 1), u(é)). (2.6) 


Ainsi, le problème du maximum de la vitesse d’un vaisseau spa- 
tial se pose de la manière suivante: pour l’objet commandé discret 
(2.5) trouver une commande u (1), u (2), ..., u (N) telle que pour 
la trajectoire correspondante x! (0), x! (1), ..., x! (N) avec la con- 
dition initiale x! (0) = H on ait la relation x! (N) = G et la somme 
(2.6) prenne sa valeur maximale. (11 va de soi que le paramètre de 
commande x est ici soumis à des contraintes du genre uw (f) > b; 
que nous n'avons pas mentionnées.) 


*) Ce problème est emprunté du livre de H. Ventsel, Eléments de program- 
mation dynamique, Editions « Naouka », Moscou, 1964, pp. 99-102 (en russe). 
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Exemple 2.3 *). Un certain produit chimique est contenu 
dans une solution d’où il faut l’extraire par lavage. Le lavage est 
effectué dans V appareils identiques, que traverse successivement 
la solution (fig. 8), l’eau de lavage et la solution ne se mélangeant 
pas pendant le lavage. La solution et l’eau de lavage peuvent être 
séparées par une mince pellicule à pénétration sélective. La quan- 
tité de produit extrait à chaque étape du lavage s'exprime par la 
fonction @ (x, u), où x est la quantité de substance dans la solution 
lorsqu'elle arrive dans l’appareil, et w la quantité d’eau employée. 
Le revenu de la production est défini par $,X — B,U où X est 





la quantité de substance extraite de la solution (à toutes les étapes 
de lavage), et U la quantité d’eau dépensée. Il s’agit de déterminer 
un régime de lavage qui garantit le revenu maximal **). 

Désignons par x (t) la quantité de substance contenue dans la 
solution lorsqu'elle sort du é-ième appareil (ou, ce qui revient au 
même, lorsqu'elle pénètre dans le (£ + 1)-ième appareil) et par 
u (t) la quantité d’eau de lavage qui traverse le t-ième appareil. 
Alors, on obtiendra par lavage dans le é-ième appareil à partir de 
notre solution (qui contenait au début une quantité de substance 
égale à x (£ — 1)) une quantité de substance égale à œ (x (€ — 1), 
u (t)), de sorte que la quantité de substance dans la solution à la 
sortie du t-ième appareil sera égale à x (t — 1) — œ (x (£ — 1), 
u (t)). Ainsi, 

x =x(t—1)— px (ft — 1), u(t)), 1 =1,2,..., N, (2.7) 


où x (0) = x, est la quantité de substance contenue dans la solution 
qui pénètre dans le premier appareil. Le revenu total de la produc- 


tion sera égal à 
N 


T=Bi(e(0)—2(N)—Be À u (0. (2.8) 


*) Cf. Fan L., Wang Ch., The Discrete Maximum Principle, New York, 1964. 

**) Remarquons qu’en réalité la solution coule continûment par 

le tuyau qui joint les appareils de lavage, mais nous pouvons imaginer qu’une 

certaine partie de la solution est séparée et reste pour un certain temps dans 

le premier appareil, ensuite pour une même période dans le deuxième, etc. Dans 
ce cas, u désignera la quantité d’eau passant par l’appareil de lavage au moment 
où il contient la partie de la solution envisagée, i.e. la vitesse de passage de 
l’eau, tandis que x peut être interprété comme concentration de la substance dans 
la solution. “e 


2--0 1208 
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Cela étant, le paramètre de commande w (t) est soumis aux con- 
traintes 
DRE bte ts 25 seu, (2.9) 


où b est défini par la construction de l’appareil de lavage. 

Ainsi, le problème du régime de lavage le plus avantageux peut 
être énoncé de la manière suivante: pour l’objet commandé discret 
(2.7), (2.9) trouver une commande u (1), u(2), ..., u (N) telle que 
pour la trajectoire correspondante x (0), x (1), ..., x (N) avec la 
condition initiale x (0) = x, la somme (2.8) prenne la valeur maci- 
male. 

Exemple 2.4%*). Notre dernier exemple sera le problème 
de transport, où il s’agit d’envoyer des produits (« matières pre- 
mières ») stockés chez les producteurs (les « entrepôts ») aux lieux 
de consommation (les « usines »). 

Pour simplifier, nous supposerons qu'il y a trois entrepôts ; 
désignons par V le nombre d’usines. Supposons, en outre, qu'il n’y 
a qu’une seule matière première et que sa réserve est égale à la de- 
mande ; autrement dit, si l’on désigne par a,, à,, a; la quantité de 
matière première dans les entrepôts, et par b,, b, ..., bx la de- 
mande des usines en matières premières, on a 


mhata-b+b+...+bx. (2.10) 


Le prix du transport de x unités de matière première du i-ième en- 
trepôt à la t-ième usine dépend de w (i.e. de la quantité de 
matière première à transporter) ainsi que de à et £ (ces nombres carac- 
térisent la longueur du trajet; fig. 4); nous désignerons ce 


prix par + (u) (fig. 5). Le problème revient à transporter les matières 
premières des entrepôts jusqu'aux usines avec des frais de transport 
minimaux. 

On peut imaginer la solution de ce problème de la manière sui- 
vante. Pour établir un régime de transport, nous choisissons tout 
d’abord la quantité de matières premières qu’il faut transporter 
du premier et du deuxième entrepôt à la première usine, ensuite la 
quantité de matières premières qu’il faut transporter de ces mêmes 
entrepôts à la deuxième usine, à la troisième, etc. Quant à la quan- 
tité de matières premières livrée par le troisième entrepôt, elle se 
définit univoquement : il faut amener à chaque usine la quantité 
de matières premières qui lui manque. Désignons donc par ut (1) 
la quantité de matières premières envoyée à la t-ième usine par le 
premier entrepôt et par u? (£) la quantité envoyée par le deuxième. 


*) La réduction des problèmes de programmation linéaire aux problèmes 
de commande des systèmes discrets est examinée dans l’ouvrage de N. Moïsséev, 
Sur l’application des méthodes de commande optimale au problème de planification 
optimale, Cybernétique, n° 2 (1966) (en russe). 
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Alors, puisque la demande de la t-ième usine en matières premières 
est égale à b,, il faudra fournir une quantité de matières premières 
égale à b; — ul (ft) — u? (t) à la t-ième usine à partir du troisième 
entrepôt. 





SS 
En - 
gl ‘-eme entre- 


pot 





Fig. 4 


Ainsi, pour établir un plan de transport, il suffit de choisir 
des nombres ut (f), u? (t), t — 1,2, ..., N; maisen les choisissant 
il faut prendre certaines précautions. Tout d’abord, les nombres 


qu 





Fig. 5 Fig. 6 


ul (t), u?(t) doivent être, d’après la signification du problème, 
non négatifs, et leur somme doit être inférieure ou égale à b;: 
u (4) >0, uw (9 > 0, ul (9) + u? (D < b:, (2.11) 
Lt ae Ni 


2x 
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Autrement dit, le «point de commande» w (#) — (u! (#), u? (£)) 
doit appartenir au triangle U, représenté sur la fig. 


u (é) € U. (2.12) 


Mais cela est insuffisant. Si nous allons élaborer le plan de transport 
(i.e. la collection des nombres ul (5), u? (1), t — 1, 2, ..., N) 
sans prendre des précautions supplémentaires, il peut arriver que 
nous choisissions un plan qui stipulera qu’un des entrepôts livre 
plus de matières premières qu’il n’en possède. Pour éviter un tel ré- 
sultat, nous prendrons note des matières premières livrées par chaque 
entrepôt. À savoir, désignons par x! (£) et x? (t) la quantité de matières 
premières livrée aux { premières usines par le premier et le second 
entrepôt respectivement : 


at (= ut A) +ult(2) +...+ul(s); 
2? (4) = u? (1) + u? (2) +... + u? (+). 
Alors, en planifiant les livraisons des matières premières à la 


(4 + 1)-ième usine, nous saurons la quantité de matières premières 
qui reste encore aux deux premiers entrepôts. Il est clair que 


a (= at(t—1)+ut(, 2 (D = x (t— 1) +u?(8, (2.13) 
D, 2 ri Ne 


où, par souci de commodité, nous avons posé 
x! (0) = 0, x? (0) = 0. (2.14) 


Puisque les réserves sont égales à la demande, i.e. la relation 
(2.10) est vérifiée, alors après la livraison des matières premières à 
toutes les N usines, les entrepôts seront vides, i.e. 


AN) = an TN) = a: (2.15) 


Il est facile de comprendre que si les relations (2.11), (2.15) sont 
satisfaites, le plan de transport sera admissible,'i.e. les usines obtien- 
dront des trois entrepôts la quantité de matières premières néces- 
saire. Dans ce cas, le coût de tous les transports (correspondant au 
plan choisi) sera égal à 


N 

TS Lobut (0) + @t(u (0) + Eu (9 — 22 (D). (2.16) 

Ainsi, le problème de transport peut être énoncé de la manière 
suivante: pour l'objet commandé discret (2.13), il faut trouver une 
commande admissible u! (t), u? (8), t — 1, 2, ..., N (ie. satisfai- 
sant à la condition (2.11)) telle que la trajectoire correspondante x! (?), 
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2° (4), é = 0, 1, ..., N (avec la condition initiale (2.14)) satisfasse 
à la condition terminale (2.15) et telle que la somme (2.16) prenne sa 
valeur maximale. 

3. Problème de commande optimale des objets discrets. En géné- 
ralisant les exemples considérés aux n°5 { et 2, nous donnerons une 
description mathématique générale des objets commandés discrets. 

Nous supposerons toujours que la variable £ (que nous appellerons 
parfois « temps ») ne peut parcourir qu’un ensemble discret de va- 
leurs, à savoir & — 0,1, ..., N, où N est un nombre naturel fixe. 

Dans tous les exemples considérés ci-dessus, sauf le dernier, nous 
n'avions qu'un seul paramètre de commande uw, alors que dans l’exem- 
ple 2.4 il y en avait deux: u!, u?. Dans le cas général, on suppose 
qu'on peut agir sur l’objet commandé en choisissant (avec un degré 
de liberté de choix plus ou moins grand) r paramètres de commande 
ul, ..., u”, ou, ce qui revient au même, un point w de l’espace des 
variables ut, ..., u”. Ainsi, à chaque moment t, le point de com- 
mande x ({) possède r coordonnées: 

u (#) = (ul (8), ..., u" (®)). 
Convenons d’appeler commande toute suite de points 


u (1), u (2), ..., u(N) (3.1) 


dans l’espace des variables u', . .., u”. 

Dans les problèmes considérés ci-dessus, l’état de l’objet était 
caractérisé par une ou deux coordonnées de phase. Dans le cas géné- 
ral, nous supposerons qu’à chaque moment # l’élat de l’objet est 
caractérisé par n coordonnées de phase x}, . .., x”, i.e. par un point x 
de l’espace Æ” des variables xl, . .., x". Ainsi, à chaque moment #, 
l’état de phase x (£) possède n coordonnées: 


LOG D ax SAT OX 
La suite 
20). a), 2:22 (0) (3.2) 


des états de l’objet aux moments { — 0, 1, ..., N sera appelée 
trajectoire du mouvement de l’objet. 

L'état initial x (0) doit être donné. Le mouvement ultérieur de 
l’objet se définit univoquement, si l’on a choisi une commande (3.1), 
à l’aide des relations 


10e Gt DL TON LT, sui, (3.3) 


Où f, (x, u) = (fi (x, u), ..., ft (x, u)) est une fonction vecto- 
rielle à valeurs dans l’espace £”. L'indice { dans la notation de la 
fonction f; (x, u) signifie que l’on ne considère plus une seule fonc- 
tion f (x, u) pour tous les moments & — 1, ..., N mais, plus géné- 
ralement, des fonctions différentes qui varient d’un moment à 
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l’autre. Mais si la fonction jf; (x, u) ne dépend effectivement pas 
de é, nous avons alors une seule fonction f (x, u) et la relation (3.3) 


prend la forme 
t( =f(x(t— 1), u (). 


(C'est justement ce cas qui s’est rencontré dans les problèmes con- 
sidérés précédemment ; ainsi, dans l’exemple 1.1, le comportement 
de l’objet commandé discret est décrit par les relations (1.1), (1.2) 
dont les seconds membres ne dépendent manifestement pas de £.) 

La relation (3.3) est la loi de mouvement de l’objet commandé 
discret. La trajectoire (3.2) qui satisfait à la relation (3.3) sera 
appelée trajectoire correspondante à l’état initial x (0) et à la com- 
mande (3.1). | 

Ensuite, pour chaque point x € E" et chaque té — 1, ..., N, 
on a défini dans l’espace des variables ul, . .., u” un certain en- 
semble non vide U, (x) qui est le domaine de commande correspon- 
dant au moment t à l’état de phase x. Nous ne considérerons que les 
équations (3.1) qui satisfont à la condition (cf. (1.5), (1.9) et (2.12)): 


u (DEV: at—1),t1—-1,..,N, (3.4) 


où la trajectoire (3.2) est issue du point initial x (0) et correspond à 
la commande (3.1). Les commandes qui satisfont à cette condition 
seront dites admissibles (relativement à l’état initial x (0)). 

Les relations (3.3), (3.4) déterminent justement un objet discret 
commandé. Le processus de commande d’un tel objet est effectué 
de la manière suivante. L’état de phase initial x (0) étant défini, 
nous connaissons le domaine de commande correspondant U, (x (0)). 
En vertu de (3.4), nous pouvons choisir un point de commande 
quelconque uw (1) € U, (x (0)), d’où nous pourrons déterminer l’état 
de phase x (1) au moment & — 1 (voir (3.3)). Ensuite, connaissant 
x (1), nous pouvons considérer le domaine de commande corres- 
pondant U, (x (1)). Ensuite, en choisissant un point de commande 
quelconque uw (2) E U, (x (1)) (voir (3.4)), nous pourrons trouver 
l’état de phase suivant x (2) (voir (3.3), etc.). Il est évident que la 
commande (3.1) obtenue par itération de cette construction est 
admissible (relativement à l’état initial x (0)), et la trajectoire (3.2) 
obtenue est la trajectoire qui correspond à cette commande. 

Formulons maintenant le problème de commande optimale pour 
un objet discret commandé (3.3), (3.4). Pour cela, supposons qu'on 
se donne des fonctions f? (x, u), & — 1, ..., N. En qualité de cri- 
tère d'efficacité, i.e. de fonctionnelle qui montre dans quelle mesure 
le processus choisi (3.1), (3.2) est « avantageux », nous choisirons le 
critère suivant : 


J = PA (0) 2 (DA CCD) BD 2 AR (EN), (ND = 
2 fi(x(t—1), u(#)). (3.5) 
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Le problème de commande optimale consiste à choisir, connaissant 
l’état initial x (0), une commande admissible (3.1) pour l'objet (3.3), 
(3.4) telle que la fonctionnelle (3.5) prenne la valeur maximale. (Dans 
certains cas, il peut s'agir de la valeur minimale de la fonc- 
tionnelle (3.5); c'est justement le cas que nous avons considéré 
dans l’exemple 2.4.) 

Ce problème, que nous appellerons problème fondamental, peut 
être caractérisé comme problème de commande optimale à extré- 
mité gauche fixe et à extrémité droite libre. Autrement dit, l’état 
initial x (0) est supposé défini, tandis que l’état à l'extrémité droite 
du segment de temps, i.e. x (N), n’est aucunement réglementé (il 
faut seulement que la valeur de la fonctionnelle (3.5) soit maximale). 

Le problème considéré dans l’exemple 2.8 est un problème typi- 
que de commande optimale à extrémité gauche fixe cet à extrémité 
droite libre. 

En plus du problème fondamental, on peut également considérer 
le problème à extrémités libres. Dans ce cas, on suppose que l’on 
définit deux ensembles M, et M, dans l’espace de phase £" et l’on 
pose le problème suivant: trouver une condition initiale x (0) € M, 
et une commande admissible (relativement à x (0)), telles que la rela- 
tion x (N) E MX soit vérifiée et que la fonctionnelle (3.5) prenne sa 
valeur maximale. 

Il est clair que si M, consiste en un seul point et My coïncide 
avec l’espace de phase £”, le problème à extrémités libres se réduit 
au problème fondamental étudié ci-dessus. 

D'autre part, si chacun des deux ensembles M,, MY consiste 
en un seul point (i.e. l’on a défini d'avance aussi bien l’état ini- 
tial x (0) que l’état terminal x (N)), nous obtiendrons le problème à 
extrémités fixes. 

Dans l’exemple 1.2 nous avons rencontré un problème à extré- 
mité gauche fixe et à extrémité droite mobile (voir (1.7)). Dans les 
exemples 2.2 et 2.4, nous avons considéré des problèmes à extrémités 
fixes. 

Enfin, le cas suivant est possible. Pourchaque £ — 0, 1, ... 
..., N,on définit dans l’espace de phase Æ£7 un certain ensemble 7, 
et l’on cherche un état initial x (0) et une commande admissible (3.1) 
(relativement à x (0)) tels que les relations x (t) € M;,,t— 0,1, ..., N, 
soient vérifiées et que la fonctionnelle (3.5) prenne sa valeur maximale. 
Convenons d'appeler ce problème problème à contraintes imposées aux 
coordonnées de phase. Pour M,=—...— My, — ET" il se trans- 
forme en le problème à extrémités mobiles. 

Ainsi, le problème avec les contraintes imposées aux coordonnées 
de phase est le problème le plus général parmi les problèmes con- 
sidérés. Un problème à contraintes imposées aux coordonnées de 
phase a été examiné dans l’exemple 2.1 (voir la relation (2.4) qui 
a la forme x (#) € M,, où M; est la demi-droite [0, )). 
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4. Autres énoncés de problèmes de commande discrète. Les pro- 
blèmes de commande optimale des objets discrets, énoncés dans la 
section précédente, sont le sujet principal de cet ouvrage. C’est 
justement pour les problèmes ainsi posés que l’on obtient les résul- 
tats fondamentaux. Néanmoins, ces problèmes (même le plus général 
d’entre eux: le problème à contraintes imposées aux coordonnées 
de phase) ne sont pas universels. Dans la théorie des systèmes dis- 
crets on rencontre également d’autres énoncés de problèmes: pro- 
blèmes optimaux pour lessysièmes à réaclion,objets discrets à relard, 


T a, LA 





Fig. 7 


etc. Nous considérerons ici certains de ces problèmes et nous mon- 
trerons de quelle façon ils se réduisent aux problèmes énoncés dans 
la section précédente. 

Systèmes à réaction. Considérons à nouveau le pro- 
blème de l’extraction successive d’un produit chimique en solution 
(exemple 2.3). Si le processus de lavage s'effectue très lentement, 
la solution qui sort du V-ième appareil contient toujours une quan- 
tité non négligeable de produit et l’évacuation de cette solution en- 
traîne des pertes importantes. Dans ces cas, il est avantageux d’éva- 
cuer une petite partie de la solution qui sort du V-ième appareil de 
lavage en renvoyant le reste à l’entrée du premier appareil, réa- 
lisant ainsi la « liaison en retour » (fig. 7). Avec ce schéma de travail, 
la plus grande partie de la solution passera plusieurs fois par tous 
les N appareils, ce qui augmentera le pourcentage du produit ex- 
trait. 

On voit facilement que dans le cas considéré (i.e. pour un schéma 
à liaison en retour) les relations (2.7) à (2.9) ne changent pas: il ne 
faut changer que la condition initiale x (0) — x,. En effet, puisque 
la solution qui pénètre dans le système de lavage (et contient le 
produit en quantité xs)se mélange avec une partie de la solution 
qui sort du V-ième appareil, la valeur de x (0) (i. e. la quantité de 
produit dans la solution qui pénètre dans le premier appareil) ne sera 
donc plus égale à x,, mais représentera une certaine combinaison 
des quantités x, et x (N), par exemple, 


kz (N 
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Autrement dit, à la place de l’égalité x (0) — x,, nous aurons main- 
tenant une certaine relation entre x (0) et x (NW) qui, dans le 
cas général, peut s’écrire sous la forme @ (x (0), x (N)) — 0. 

En généralisant, nous pouvons dire que le système mathémati- 
que discret à réaction se décrit par les relations (3.3), (3.4), avec des 
conditions supplémentaires de la forme 


DE UO) EN) = 0 ie 12: sui 1 (4.1) 


(qui remplacent les conditions imposées auparavant, i.e. x (0) € 
EM,,xz (N)E My). ]Ilse peut qu’en outre on impose des contraintes 
aux coordonnées de phase: x (t) € M;,, t — 1, 2, ..., N — 1. Le 
problème, tout comme auparavant, consiste à maximiser la fonc- 
tionnelle (3.5), toutes ces conditions étant satisfaites. Le problème 
ainsi posé peut Ôtre réduit aux problèmes considérés au n, 3 à l’aide 
de la méthode suivante. Ajoutons à la variable de phase x — 


= (xt, 22, ..., x") une nouvelle variable y—(x"*!, . . .,x?"), sujette 
aux conditions suivantes : 

y) =y(t—1),t=1,...,N; (4.2) 

y (0) = x (0). (4.3) 

Il est clair qu’en vertu de ces conditions on a y (0) — y (1) = ... — 

== y (N) = x (0), et la relation (4.1) peut donc s’écrire sous la forme 

DU UN), SN) = 01 = 1, 2; su, Le (4.4) 

Nous obtenons donc le problème suivant. Supposons donnés 

2n coordonnées de phase x, ..., x", x", .,.., x?" et les mêmes r 

paramètres de commande ul, ..., u” qu'auparavant. Les relations 


(3.3), (3.4), (4.2) définissent un objet discret commandé. La relation 
(4.3) signifie que le point initial (x (0), y (0)) appartient à à l’en- 
semble M? défini dans l'espace des variables x!, x?" par les 
équations xt — 2%", i — 4, 2, n. La relation (4. 5 se récrit 
alors sous la forme e r (N), y (N)) E M$, où l’ensemble MY est 
défini par les équations ®; (y, x) — 0, i — 1, ..., l, et la fonc- 
tionnelle (3.5) ne dépend que des coordonnées x!, ..., x". 

Ainsi, en augmentant (de deux fois) le nombre de coordonnées 
de phase, on a réduit le problème discret à réaction au problème à 
extrémités mobiles (ou au problème à contraintes imposées aux 
coordonnées de phase si le problème à réaction contenait les con- 
traintes x(f) € M;,, t —1, 2, ... — À). Remarquons qu’en 
doublant le nombre des coordonnées . phase, nous n'avons pas 
trop compliqué le problème, puisque les relations (4.2) sont parti- 
culièrement simples. 

Systèmes à retard. Pour s’imaginer les problèmes à 
retard, précisons l’énoncé du problème considéré dans l’exemple 2.1 
de la façon suivante. Nous prendrons maintenant en considération 
le fait qu’il y aura chaque année à la ferme des animaux d’une année, 
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encore incapables de reproduire l’année suivante, et des animaux 
mûrs. Nous supposerons que si le nombre d'animaux mûrs restés 
à la ferme est égal à y, alors l’année suivante ils auront ky pour 
accroît. On suppose également que l’on envoie seulement les ani- 
maux mürs à l’abattoir. 

Conservons les mêmes notations x (£), u (t) que dans l'exemple 2.1. 
Alors, à la t-ième année, seuls les animaux qui sont nés à la (4 — 2)- 
ième année ou avant reproduiront; il s’agit donc d'animaux qui 
ont été laissés à La ferme à la fin de la (£ — 2)-ième année et y sont 
restés jusqu’à la t-ième. Mais on avait laissé à la ferme à la (4 — 2)- 
ième année une quantité d'animaux égale à x (£ — 2), dont u (t — 1) 
ont été envoyés aux abattoirs à la (4 — 1)-ième année. Par consé- 
quent, il y avait à la t-ième année x (4 — 2) — u (t — 1) animaux 
mûrs à la ferme et leur descendance à la -ième année sera de k (x (4 — 
— 2) — u (t — 1)) têtes. Il en découle qu’il y aura avant l’abattage 
de la t-ième année x (£ — 1) + k (x (£ — 2) — u (té — 1)) animaux 
à la ferme. Après l’abattage, cette quantité d'animaux diminuera 
de u (t) et la quantité qui reste sera toujours à la ferme à la fin de 
la t-ième année. Ainsi, 


zx =z(t—1)+k(x(t—2)—u(t—1)—u(, (45) 
DR LE 


Nous voyons que, contrairement à (3.3), cette relation est de 
la forme 


z()=f}(@(t—-1), zG—2)}; ut), u(—1)), (4.6) 
2:09, ui 


i.e. l’état de phase x ({) dépend non seulement de x (£ — 1) et de 
u (t) mais aussi des valeurs précédentes x (6 — 2), u (t — 1). Re- 
marquons que la relation (4.5) est écrite ici seulement pour { — 
— 2, ..., N, car, si l’on y pose { — 1, le second membre contiendra 
les quantités x (—1) et u (0) non définies dans le problème. Les 
quantités x (0), x (1) doivent donc être définies séparément, et les 
autres états x (2), ..., x (N) s’obtiendront suivant la formule (4.5). 

D'ailleurs, si nous connaissions la quantité de bovins à la ferme 
un an avant le début de la planification (i.e. x (—1)) et la quantité 
à l'abattage l’année précédant le début de la planification (i.e. 
u (0)), la relation (4.5) aurait également un sens pour # — 1. 

Un autre exemple de système à retard est donné par lesfrac- 
tions continues; toute fraction continue est de la forme 


Dr 9 (4.7) 
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OÙ Go; y, - + «+, AN Sont des nombres entiers. Interrompant la frac- 
tion (4.7) au nombre a;, nous obtenons l’expression 


Qt ——<— (4.8) 


1 
pr 
que l’on appelle t-ième fraction approchée de la fraction continue 


(4.7). Si l’on se débarrasse dans (4.8) des fractions « à plusieurs éta- 
ges », on peut récrire cette expression sous forme de fraction ordi- 


e # e. P; 
paire, que nous désignerons par —. Par exemple, 


Q: 

__ ag ___ Po. 1 aoai+1 _ P1. 
MT A Op do di 4 Qi” 
1 Apa4ao + ag + a2 __ Po 
joe Pie = ie Poe 0 
RE ma Q 

a 


Ainsi, les numérateurs et les dénominateurs des fractions ap- 
prochées peuvent être déterminés de la manière suivante: 


P5 = &o; P; = aça + 1, P, = aplyte + 4 + @, ss. 
Qo = À, Qi = &, Où = Ado + 1, ... 


On peut démontrer par récurrence *) que les numérateurs et les dé- 
nominateurs des fractions approchées se déterminent par les rela- 
tions 


Pr= aiP; + Pi, Qr= Qi +Qte. (4.9) 


(Remarquons que ces relations sont vérifiées pour t = 2, 3, ... 
..., N ; néanmoins, si l’on pose tout à fait formellement P_, = 1, 
Q_, = 0, ces relations seront également vraies pour & = 1.) 

Nous pouvons maintenant imaginer que quelqu'un choisit arbi- 
traitement une commande 


u (1) = a, u (2) = as, ..., u(N)=ax 


et calcule successivement les fractions approchées; la première, la 
deuxième, etc., en considérant leur numérateur et leur dénomina- 
teur comme coordonnées de phase: 


æ° (1) = Pi, 2° (1) = Q:5 æ° (2) = P», 
2° (2) = Q:5 ...5 a (N) = Px, a (N) = Qw. 


*) Voir, par exemple, A. Khintchine, Fractions continues, Gostekhizdat, 
Moscou-Léningrad, 1949, pp. 10-12 (en russe). 
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Alors les relations (4.9) déterminent un objet discret commandé 


xt (D) = u(t)at(t — 1) + xt (t — 2), x? (4) — 
= U (ba? (ft — 1) + x? (6 — 2). (4.10) 


Ici aussi, contrairement à (3.3), les seconds membres dépendent 
non seulement de w (é), x (t — 1), mais aussi de x (4 — 2). 

Les objets discrets (4.5), (4.10) considérés ci-dessus s'appellent 
objets à retard (puisque x (£ — 2), i.e. l’information sur l’état de 
l’objet au moment # — 2, participe non seulement à la formation de 
l’état x (t — 1), mais aussi, comme si elle arrivait en retard, par- 
ticipe au moment £ à la formation de l’état x (£)). 

Dans le cas général, l’objet discret à retard d’une itération peut 
être écrit de la manière suivante. Soient x = (x!, ..., x") le vec- 
teur de l’état de phase et u — (ul, . .., u”) le vecteur de commande. 
On connaît la préhistoire du processus, i.e. les états x (—1) et x (0); 
le comportement ultérieur de l’objet est défini par les relations 


zx =fh (a(t—-1), zt—2), u(t)},t1—=1,2,...,N. 
(4.11) 


Le problème consiste à trouver une commande w (1), u (2), 
., u (N) qui détermine la trajectoire x (—1}), x (0), x (1), 
., & (N) maximisant la fonctionnelle 


J — DEL (t—1), z(t—2), u(t)) 


(il est possible que l’on impose en même temps des contraintes du 
genre w (f) E U; (x (£ — 1), x (ft — 2)) à la commande et des con- 
traintes du genre x (it) € M}, aux coordonnées de phase). 
Pour réduire ce problème aux problèmes considérés au n°8, 
introduisons une variable de phase supplémentaire y — (x"*t, 
x?) soumise aux conditions: 


y(t)=x(t—1), é — 0, 1, ..., N. (4.12) 


Alors, y (0) = x (—1) et la relation (4.11) peut se récrire sous la 
forme 


zx) =fhi (xt —- 1), y(t—1),u(b), 1 =1,2,..., N, (4.13) 
la contrainte u (ft) E U, (x (t — 1), x (t — 2)) prenant la forme 


u (9) € Ur (x (Et — 1), y (Et — 1). (4.14) 
Nous venons donc à poser le problème suivant. Il y a mainte- 
nant 2n coordonnées de phase xt, ..., x", AE es MP et. 168 


mêmes r paramètres de commande ul, ..., u” qu'auparavant. Les 
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relations (4.12) à (4.14) déterminent un objet discret commandé 
pour lequel le point initial (x (0), y (0)) est donné ; il s’agit de maxi- 
miser la fonctionnelle 


N 
J= D RG, V1), (D). 


Ainsi, en augmentant (doublant) le nombre de coordonnées de 
phase, nous avons réduit le problème discret à retard (d’une ité- 
ration) au problème à extrémité gauche fixe. | 

Le cas où le second membre de la relation (4.11) contient égale- 
ment u (t — 1) (cf. (4.6)) nécessite l’introduction d’autres coordon- 
nées de phase supplémentaires. À savoir, en introduisant (en plus 
de x et y déjà donnés) encore une coordonnée de phase z — (x?"*!, . 

., æ?+) et en imposant les conditions 


Z (#) - (£), 
nous pourrons récrire les relations du genre (4.6) sous la forme 


2 (= —1), yG—1), u (6), z (4 — 71), 


qui s'accorde parfaitement avec l’expression de l’objet commandé 
sous la forme (3.3). 

Remarquons enfin que l’on rencontre les objets discrets com- 
mandés à retard de 6 itérations (où 6 est un nombre naturel infé- 
rieur à ÂV), i.e. les objets décrits par les relations de la forme 


zO=fht—1);x(t— 2), ..., x —0—1), ut), 


(4.15) 
be LUN. 


où l’on suppose donnée la préhistoire x (—6), x (—6 + 1), ... 

., æ (—1), x (0) et où l’on impose peut-être des contraintes aux 
paramètres de commande et aux coordonnées de phase. Pour de tels 
objets l’introduction d’une variable de phase supplémentaire y — 
= (2"#l, ,.., x) soumise à la condition (4.12), diminue 6 de 
l'unité, i.e. réduit l’objet considéré à un autre objet à retard de 
6 — Î itérations. Ainsi, en introduisant en nombre suffisant des 
coordonnées de phase supplémentaires, nous pouvons réduire l’objet 
(4.15) à un objet sans retard. 

Systèmes à nombre de coordonnées de 
phase variable. Dans certains cas, il faut considérer des 
processus dans lesquels le nombre de coordonnées de phase qui 
décrivent le comportement de l’objet peut varier avec le temps dis- 
cret {. Supposons, par exemple, que dans le système de lavage (voir 
exemple 2.8), après Le (6 — 1)-ième appareil, le courant se sépare en 
deux pour se réunir ensuite de la manière indiquée sur la fig. 8. 
Alors à la (4 — 1)-ième étape nous n’aurons qu’une seule coordonnée 
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de phase z', à La é-ième et à la (4 + 2)-ième étape, deux PoPionnees 
xt, x? et à la (£ LA 1)-ième étape, trois coordonnées de phase x!, x°, 
ñ. Il en est de même du nombre de paramètres de commande. Dans 
É cas général, l’objet à nombre de coordonnées de phase et de para- 
mètres de commande variable s'écrit de la même manière que dans 


a E-1)] uŸ#) | 2le+) 


= | | 





Fig. 8 


la section 3 (voir (3.3)), mais maintenant x (£) est un vecteur dont 
le nombre de composantes est fonction de t: 


x (t)—={(xt (6), 22(4),...,2"t()), 1—=0,14,...,N;: 
il en est de même de la commande: 
u(t)=(ui(#), w2(8),...,ut(t)), t—=1,2,...,N. 


Un tel objet se ramène facilement aux objets considérés au n° 3. 
Désignons en effet par nr le plus grand des nombres n,, 
Pi, - -., An. Alors tout vecteur x (f) possède au plus n com- 
posantes. Maïs nous pouvons considérer que le vecteur x (£) a exac- 
tement z composantes, en mettant des zéros aux endroits manquants: 


z(t)= (xt (à), 22(t), ...,x"t(#), 0, 0, ...,0) (4.16) 


(ici nous avons ajouté nr — n;, zéros), et en récrivant la relation (3.3) 
en coordonnées de la manière suivante: 

. fi(æ(t—1), u(t pour i—=1,...,n;; 

x = SE 7 (4.17) 

0 pour i— 7 +1, 


Bien entendu, dans l’expression (4.16), les dernières n — n; coor- 
données (les zéros) ne dépendent pas du processus de commande choi- 
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si et n’influent aucunement sur les états de phase ultérieurs. Mais 
ce n’est là qu’une question de notation pour l'équation (4.17). Il 
nous importe ici de savoir que par cette méthode formelle nous avons 
ramené l'expression de l’objet à nombre de coordonnées de phase 
variable à une expression à nombre de coordonnées de phase c o n s- 
tant, la loi de mouvement de cet objet s’écrivant sous la forme 
(4.17), donc s’accordant avec (3.3). 

Fonctions d'état terminal. Remarquons que dans 
l'expression de la fonctionnelle (3.5), l’état terminal x (NW) n’appa- 
raît pas. On rencontre toutefois des problèmes où justement l’état 
terminal x (N) caractérise l’efficacité du processus, i.e. pour cri- 
tère d’efficacité on prend une certaine fonction 


J = (x (W)) (4.18) 


de l’état terminal x (N). Un tel cas a été considéré dans l’exemple 1.1. 

On peut également envisager un cas plus général, où le critère 
d'efficacité contient aussi bien la somme (3.5) qu’une expression 
de la forme (4.18), i.e. s'écrit 


J= pe (ND + D (1), u (0). (4.19) 


Un tel cas a été rencontré dans l’exemple 2.8. 

Supposons que le critère d'efficacité pour l’objet commandé 
(3.3), (3.4) est donné sous la forme (4.18). Alors, prenant en considé- 
ration la relation x (N) = fx (x (N — 1), u (N)) (voir (3.3)) et 
posant 


=fo—...=fn 1 =0, fN(G(N—1), u(N))= 
= p (fx (G(N—1), u(N)))=(x(W)), 


nous obtenons 
N 
p(z(N))= fx (x (N—1), u(N)) 2 fi (æ(é—1), u(6)). 


Ainsi, la fonctionnelle de la forme (4.18) se ramène facilement à la 
forme (3. 9). De la même manière on peut ramener la fonctionnelle 
(4.19) à la forme (3.5). 

Il est également utile de savoir qu’à son tour la fonctionnelle 
de la forme (3.5) peut toujours être ramenée à la forme (4.18). En 
effet, étant donné un objet discret commandé (3.3), (3.4), supposons 
que l’on se propose de maximiser la fonctionnelle (3.5). En supposant 
que æ — (xt, ..., x") et u — (ul, ...,u’) ont la même signi- 
fication qu'auparavant, introduisons une coordonnée de phase 
supplémentaire x**! soumise aux conditions: 


z"#1 (0) = 0 
a"# (é) = a (4 —1)+ f$ (x (6—1), u (6). 
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Il est alors clair que 
gi ( DA (t—1)},u(t)), 0—1,2,...,N, 


et en particulier z"*! (N) = J (voir (3.5)). Aïnsi, la fonctionnelle 
(3.5) prend la forme xz"*! (NW), i.e. se réduit à la forme (4.18) (et, 
pour cela, il suffit d'introduire une seule coordonnée de phase sup- 
plémentaire). 

Problème isopérimétrique On appelle ainsi 
(dans le cas des objets discrets) le problème suivant. Soit un objet 
discret commandé (3.3), (3.4). Pour cet objet, considérons la fonc- 
tionnelle J définie par la formule (3.5), et encore k fonctionnelles de 


la même forme : 
N 


Ji 2 gi (x(t— 71), u(#)), 
SUR S a dlas sert (4.20) 


N 
Ji= 2 gé (t(é—1), u(#)). | 


Enfin, supposons donnés # nombres réels c,, Co, ..., Cr. Le pro- 
blème consiste à ne considérer que ceux des processus (3.1), (3.2) pour 
lesquels les fonctionnelles (4.20) prennent les valeurs données 


Ji = Ci: à 5 Pi CR 
et trouver parmi ces processus celui qui maximise la fonctionnelle 
(3.5). (IL est possible que l’on impose en même temps des conditions 
aux extrémités ou des contraintes aux coordonnées de phase.) 
Ce problème se réduit tout aussi simplement aux problèmes con- 


sidérés au n° 3. À savoir, introduisons des coordonnées de phase 
supplémentaires x"°#!, ..., x"** qu'on soumet aux conditions: 


a (0)=0, i—1,2,...,k; (4.21) 
ati (ati 1) (c(t—1), u(), i=1,2,...,k, (4.22) 
où æ— (xl, ..., ax") et u — (ul, ..., u") ont la même signifi- 
cation qu'auparavant. Alors, 
Ô 
a+ (0) = > gt(z(t—1)},u(t)); 0—1,2,...,N: i—1,2,...,k; 
=1 
et, en particulier, 
LUN)=T,, i=1,2,...,k. (4.23) 


Les conditions imposées par l’énoncé du problème J, = c,, ... 
... Jr —= Cr peuvent s’écrire sous la forme 


a(N)=c, i=1,2,...,k, 
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i.e. elles se transforment en conditions sur l'extrémité droite. Ainsi, 
en augmentant le nombre de coordonnées de phase, on ramène le 
problème isopérimétrique aux problèmes considérés au n° 3. 
Nous avons considéré plusieurs modifications du problème des 
objets commandés. Il va de soi que l’on peut rencontrer également 
leurs combinaisons (par exemple, l’objet à réaction et à retard). 
On peut rencontrer également d’autres modifications plus spéciales 
que nous n’envisageons pas ici. Ce qui a été dit dans cette section 
doit néanmoins nous convaincre que l’introduction de variables sup- 


plémentaires ramène ces problèmes aux problèmes considérés 
au n° 3. 


5. Maximisation de plusieurs fonctionnelles. Les ingénieurs posent souvent 
la question suivante aux mathématiciens : comment faut-il commander un objet 
pour maximiser non plus la seule fonctionnelle (3.5), mais plusieurs fonc- 
tionnelles données du même type. Il est 
cependant clair qu'une telle question est 
mal posée: il faut savoir concilier les 
désirs et les réalités. 

En effet, si pour l’objet discret com- 
mandé (3.3), (3.4) nous posons le pro- 
blème de maximisation de la fonction- 
nelle (3.5), nous obtiendrons, en règle 
générale, un seul processus optimal 
bien défini qui résout notre problème. 
Mais si maintenant pour ce même objet 
(3.3), (3.4) nous considérons le problème 
de maximisation d’une autre fonc- 
tionnelle, nous obtiendrons également, 
en général, un autre processus optimal 
bien défini qui résout le problème. Ceci 
étant, les deux processus optimaux 
trouvés ne doivent pas nécessairement 
coincider ; au contraire, en règle générale, ils seront distincts, i.e. la 
commande qui donne le maximum de la première fonctionnelle ne maximise 
pas la deuxième (et inversement). 

Ainsi, il n’y a pas lieu de supposer que nous serons capables de choisir 
une commande qui maximise en même temps les deux fonctionnelles: 
ceci ne peut arriver que dans certains cas exceptionnels. 

Une excellente illustration de ce que l’on vient de dire est le problème de 
maximisation des fonctions. Soient f(x), g (x) deux fonctions définies sur 
un segment. Le maximum *) de la fonction f (x) est en règle générale atteint 
en un seul point (fig. 9), de même que le maximum de la fonction g(x). Mais 
alors, généralement, ces fonctions atteignent leur maximum en des points 
différents, et ce n’est que dans des cas exceptionnels qu’il arrive aux 
fonctions d'atteindre leurs maximums au même point. Le problème de « trouver 
le point où les deux fonctions f et g atteignent leur maximum » est donc 
un problème mal posé (i. e. il est en règle générale impossible à résoudre). 

Mais, toutefois, l’activité pratique nous pose le problème (ou, pour mieux 
dire, le souhait) de maximiser en même temps plusieurs fonctions (ou 
plusieurs fonctionnelles dans le cas d’objets discrets commandés). Dans l’exem- 
ple 2.1, ce seront les souhaits de maximiser la quantité de bovins envoyés 


*) Nous considérons partout seulement le maximum absolu, ji.e. la 


plus grande valeur de la fonction; les maximums relatifs (locaux) ne sont pas 
pris en considération. 


3—01208 





Fig. 9 
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à l’abattoir tout en maximisant la quantité de bovins qui restent à la 
ferme vers la fin de la période planifiée. Il est clair que ces deux souhaits sont 
en contradiction (plus on livre de bovins à l’abattoir, moins il en reste à la 
ferme), ce qui illustre une fois de plus le fait que le problème de maximisation 
simultanée de deux fonctionnelles (ou plus) n’est pas légitime. 

On peut chercher divers remèdes à cette situation. L’un d’entre eux (voir 
p. 15) consiste à fixer la quantité de bovins à la ferme vers la fin de la période 
planifiée (et rejeter ainsi la deuxième fonctionnelle) et à rechercher dans ces con- 
ditions le maximum de la seule fonctionnelle qui reste: le revenu sur les 
livraisons. 

Ainsi, lorsqu'on souhaite d’obtenir la maximisation simultanée. dans la 
mesure du possible, de deux fonctionnelles ou plus, il faut introduire des préci- 
sions dans la position du problème. Par exemple, dans le même problème de la 
ferme d’élevage, on peut fixer la quantité annuelle de bovins livrés à un certain 
niveau admissible pour obtenir une quantité maximale de bovins à la ferme 
vers la fin de la période planifiée. Ce n’est qu'une fois le problème précisé d’une 
façon ou d’une autre que nous aurons un vrai problème mathématique. Les 
mathématiques ne sont pas toutes-puissantes; il faut au moins savoir ce que 
nous voulons, ce qui est plus important et ce qui l’est moins. 

Il existe néanmoins des méthodes mathématiques pour préciser la 
situation de maximisation simultanée de plusieurs fonctionnelles. Certaines 
d’entre elles seront décrites dans cette section. Soulignons que le choix des métho- 
des et de leur forme ne se rapporte pas à la compétence des mathématiques et 
doit être effectué par les planificateurs, les constructeurs, les exploitants et 
autres ingénieurs spécialisés. 

Ainsi, supposons que l’on considère l’objet discret commandé (3.3), (3.4) 
et que l’on souhaite d’obtenir des valeurs aussi grandes que possible pour plu- 
sieurs fonctionnelles de la forme (3.5), à savoir 


1=1 


à | 
fi 2 ete t—1) ut) | 
l (5.1) 


N 
= À 80, (9. | 
=] 


(Il va de soi qu’on peut encore avoir des conditions aux extrémités ou des con- 
traintes imposées aux coordonnées de phase dont nous ne parlons point, puis- 
qu'elles ne se rapportent pas à la question discutée ici.) 

Une des méthodes pour préciser ce souhait (et le ramener à un problème 
strictement mathématique de commande optimale d’un objet discret) consiste 
à fixer des valeurs minimales admissibles (du point de vue du problème 
envisagé) de toutes les fonctionnelles (5.1), sauf une seule, et à trouver dans ces 
conditions le maximum de la fonctionnelle restante. 

Illustrons ce procédé sur l’exemple où l’on souhaitait d'obtenir le maximum 
simultané de deux fonctions. Puisque ce souhait est irréalisable (voir fig. 9), 
nous exigerons que la fonction g (x) prenne une valeur supérieure ou égale à un 
nombre donné c, et sous cette condition nous chercherons le maximum de la 
fonction f(x). La condition g (x) > c détermine dans le segment [a, b], sur le- 
quel sont définies les fonctions f (x) et g (x). un certain sous-ensemble (mis en 
relief sur la fig. 10). C’est sur ce sous-ensemble que nous devons chercher le 
maximum de la fonction f (x); le point xo sur la fig. 11 nous montre la solution 
de ce problème. Remarquons que nous avons dû transiger quant à la valeur de 
la fonction f (x) (i.e.négligeant la condition g (x) > c nous aurions pu choisir 
une plus grande valeur de la fonction f ; comparer les points À et C sur la fig. 11), 
mais en revanche, en précisant de cette manière le problème (i. e. en imposant 
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la condition g (x) > c), nous sommes parvenus à reconcilier dans une certaine 
mesure les souhaits contradictoires de la maximisation de la fonction j (x) et de 
la fonction g (x). 

Revenons aux fonctionnelles (5.1) et précisons le problème de la ma- 
nière suivante. Etant donné les nombres c,;, Car + + +» Ch-1» trouver parmi 
tous les processus (admissibles) (3.1), (3.2) qui satisfont aux conditions J, > 
Z Ce. Jp > CR Celui qui maximise la fonctionnelle J}. 





Fig. 10 Fig. 11 


Ce problème se réduit aux problèmes considérés au n° 3 d’une manière ana- 
logue au problème isopérimétrique (p. 32). A savoir, introduisons des coordon- 
nées de phase supplémentaires 2#1, ..., x"+k-1 soumises aux conditions: 


anti (0)=0, i—1,2, ...,k—1;: 
anti (té) anti (1) Lg (x (t— 1), (8), i=1, 2, ...,k—1 
(voir (4.21), (4.22)). Alors (cf. (4.23)) 
aNHÉ(N)=T;, i1—1,92,..., k—1, 


et, par conséquent, les conditions imposées J, > «1, ..., Jp_1 > Cr 1 S’écri- 
vent sous la forme 


anti(N)Des, oi, 2,..., k—1, 


i. e. elles se transforment en conditions sur l’extrémité droite. Il nous reste 
alors une seule fonctionnelle J, à maximiser. 

Considérons une autre méthode, elle aussi souvent appliquée. Supposons 
que l’on considère à nouveau l’objet discret commandé (3.3), (3.4) et on souhaite 
d'obtenir, dans la mesure du possible, les plus grandes valeurs de 4 fonctionnel- 
les (5.1). Mais ces fonctionnelles ne sont pas d'égale importance : certaines d’en- 
tre elles jouent, de notre point de vue, un rôle plus important, d’autres un rôle 
moins important. 

Prenant ceci en considération, choisissons des poids, i. e. des nombres posi-. 
Lis Bu, Bo - . ., Pr, qui caractérisent, de notre point de vue, l'importance des 
fonctionnelles J,, J,, ..., J} (i. e. on associe aux fonctionnelles plus impor- 
tantes des poids plus grands). Maintenant, à la place de & fonctionnelles (5.1), 
nous considérerons une seule fonctionnelle J qui comprend les fonctionnelles 
Ji, Jo, . . ., Jh avec leurs poids: 


N 
DeBili+ + Bla NS (Bigf (x (t—1), u (D) +... 
11 


Bref (œ(—1), u(#)). (5.2 
3% 
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Nous obtenons ainsi le problème de maximisation d’une seule fonctionnelle 
J définie par la formule (5.2). 

Cette méthode a été appliquée dans l’exemple 2.3 (p. 17). Nous y considé- 
rions deux fonctionnelles que l’on souhaitait rendre aussi grandes que possible : 
la fonctionnelle J, = x (0) — x (NW), i. e. la HAE de produit obtenu à partir 


de la solution, et la fonctionnelle J, = — >» u (&) exprimant la quantité d’eau 
i—1 

employée, prise avec le signe moins (le maximum de cette fonctionnelle signifie 
minimum de dépense d’eau). Il est clair qu’il est impossible de maximiser 
en même temps les deux fonctionnelles: le maximum de la fonction- 
nelle J, s'obtient pour une dépense d’eaunulle, ce qui correspond à une quan- 
tité de produit obtenu également nulle (i.e. non pas au maximum, mais au mini- 
mum de la fonctionnelle J,). 

Pour reconcilier ces souhaits contradictoires, nous considérons la fonction- 
nelle J = 6,7, + B.J, (voir (2.8)), où les « poids » B,, B, peuvent être choisis, 
pee exemple, de la manière suivante: $, est le prix de vente du produit et f, 
e prix de revient de l’eau. Dans ce cas, J peut être interprétée comme le revenu 
de l’entreprise. 

Notons que le remplacement de: plusieurs fonctionnelles (5.1) par leur com- 
binaison linéaire (5.2) n’est évidemment pas la seule possibilité. Dans le cas 
général, on peut préciser le problème en prenant la fonctionnelle 


Tr, Jasee di) (5.3) 


où F est une fonction de k variables. Le choix d’une fonction F à cette fin (ou 
même dans le cas plus simple (5.2), le choix des « poids » f;,, Ba, . .., Bx) ne 
se rapporte pas à la compétence des mathématiciens. Mais si la fonction (5.3) 
(ou dans un cas particulier (5.2))est choisie en partant de considérations liées 
aux applications, nous obtenons un problème mathématique de commande opti- 
male d’un objet discret, problème du type considéré au n° 3. 

Il existe une autre manière d'aborder le problème de la maximisation de 
plusieurs fonctionnelles, mais elle possède, à vrai dire, un domaine d'application 
restreint. Nous considérerons ce problème d’abord pour le cas des fonctions de 
deux variables. | 

Soient f (x, y) et g (x, y) deux fonctions des variables x, y, définies sur un 
certain ensemble A du plan des variables x, y. On cherche à maximiser (dans 
la mesure du possible) les deux fonctions, mais en premier lieu la fonction 
f(x, y), supposée plus importante. Nous pouvons alors préciser le problème 
de la manière suivante : trouver le point (x,, y.) auquel la fonction f (x, y) prend 
sa valeur maximale, et s’il existe plusieurs points où cette valeur est atteinte, 
choisir parmi eux celui où la valeur de la fonction g (x, y) est la plus grande. 

Considérons, par exemple, la fonction f(x, y) = 2 — (x + y}? (définie 
sur tout le plan des variables x, y). Cette fonction prend sa valeur maximale, 
égale à 2, non pas en un seul point du plan des variables x, y, mais dans tous 
les points de la droite x + y — 0. Par conséquent, il s’agit de chercher parmi 
les points de cette droite Le point où la fonction g (x, y) prend une valeur aussi 
grande que possible. 

On peut poser le problème pour les objets discrets commandés d’une manière 
analogue. Supposons que les fonctionnelles (5.1) sont numérotées par ordre d’im- 
portance J,, J,, . .., JA, i.e. il est plus important de donner une valeur maxi- 
male à la fonctionnelle J,, et si les processus qui maximisent cette fonctionnel- 
le J, sont nombreux, alors il faut en premier lieu choisir parmi eux le 
processus qui maximise la fonctionnelle J, ; ensuite, si ces derniers processus sont 
nombreux, il faut maximiser la fonctionnelle J,, etc. Ce problème peut être (en 
tout cas formellement) réduit au problème isopérimétrique considéré au n° 4. 

En effet, désignons parc, la valeur maximale de la fonctionnelle J, (les 
contraintes (3.4) imposées aux commandes et, le cas échéant, les contraintes 
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imposées aux coordonnées de phase étant satisfaites). Alors l'égalité J, —=c: 
est équivalente à la maximisation de la fonctionnelle J,. Remarquons que la 
recherche du nombre c, se réduit à la solution d’un problème du type considéré 
au n° 3: pour l’objet (3.8), (3.4), trouver le maximum de la fonctionnelle J.. 
Désignons ensuite par c, la plus grande valeur possible que peut atteindre la 
fonctionnelle J,, la condition J, = c, étant satisfaite. La recherche du nombre 
c, est équivalente à la solution du problème isopérimétrique : pour l’objet (3.3), 
(3.4) trouver le maximum de la fonctionnelle J, en satisfaisant à la condition 
J, = c«. Ensuite, nous passons au problème suivant : trouver le maximum de la 





Fig. 12 Fig. 13 


fonctionnelle J, en satisfaisant aux conditions J, = c1, J, = c,, etc. En fin de 
compte, nous en viendrons à un dernier problème isopérimétrique : trouver le 
Den de la fonctionnelle J, en satisfaisant aux conditions J, = «,, ... 
ss Jh-1 — CR-7. 

Pour conclure, signalons un autre problème où l’on cherche à obtenir la 
pe grande valeur possible de plusieurs fonctionnelles. Considérons à nouveau 

‘objet commandé discret (3.3), (3.4) et les fonctionnelles (5.1). Pour rendre 
notre exposé plus illustratif, considérons d’abord plus en détail le cas 4 — 2, 
i.e. le cas où il n'y a quedeux fonctionnelles J,, J2. 

Prenons un processus admissible (3.1), (3.2) pour l’objet discret commandé 
considéré (i.e. un processus qui satisfait aux conditions (3.3), (3.4) et aux con- 
traintes ce gr aux coordonnées de phase s’il y en a). Pour ce processus, les 
fonctionnelles J,, J, prennent certaines valeurs qui déterminent un point 
du plan des variables J,, J, (fig. 12). Si nous considérons tous les processus 
admissibles pour l’objet discret commandé et indiquons pour chacun de ces 
processus le point correspondant (J., J,), nous obtiendrons sur le plan des varia- 
bles J,, J, un certain ensemble D (voir fig. 12), qui nous donne une représenta- 
tion complète des valeurs possibles du couple des fonctionnelles J,, J,. Par 
exemple, sur la fig. 12 nous pouvons voir quelles sont les valeurs maxima- 
les de chacune des fonctionnelles J,, J, et se convaincre que les deux fonction- 
nelles J, et J, ne peuvent simultanément atteindre leur maximum. 

Prenons maintenant un point quelconque À = (J*, J$) de l’ensemble D 
(fig. 18). Puisque ce point appartient à l’ensemble D, il existe un proces- 
sus admissible (3.1), (3.3), tel que la fonctionnelle J, prenne la valeur J* et la 
fonctionnelle J, la valeur J$. Construisons à partir du point À des demi-droites 
parallèles aux demi-axes positifs J,, J,. Elles forment un angle droit de sommet 
au point À (hachuré sur la fig. 13). Chaque point intérieur P = (J,, J,) de cet 
angle possède la propriété suivante : ses deux coordonnées J,, J, sont respective- 
ment supérieures aux coordonnées du point À, i.e. J, > JŸ, J, > JÉ. Mais 
si le point Q = (J;, J';) est situé sur un des côtés de cet angle et ne coïncide pas 
avec le point À, alors une de ses coordonnées est égale à la coordonnée correspon- 
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dante du point À, tandis que la deuxième est plus grande; par exemple, sur la 
fig. 143 nous avons Ji = JŸ, Jo > JÉ. 

On voit donc que si l’angle droit indiqué (de sommet A) possède un point B 
commun à l’ensemble D et différent de À, le processus qui amène au point 
A = (J*, JŸ)n'est nécessairement pas optimal:en aucun sens (souli- 
gnons qu'il s’agit ici de lamaximisation des fonctionnelles J,, J,). En 
effet, le processus qui donne le point B (un tel processus existe, puisque le point B 
appartient à l’ensemble D) augmente par rapport au point À = (JŸ, J#) les 
valeurs des deux fonctionnelles J,, J, (ou, au moins, augmente la valeur Re 
de ces fonctionnelles, sans changer la valeur de l’autre). 

Ainsi, pour que le point À = (74, J,), appartenant à l’ensemble D, cor- 
responde à un processus o pt im al (dans un sens ou dans un autre), il est 
nécessaire que l'angle droit, de 
sommet À et de côtés parallèles aux 
demi-axes positifs de coordonnées, ne 
contienne pas de points de l’ensemble D 
(sauf A). En particulier, il est clair que 
tout point intérieur de l’ensem- 
ble D (par exemple, le point À’ de la 
fig. 13) ne peut satisfaire à cette condition 
nécessaire et ne peut donc correspondre 
à un processus optimal, quelle que soit 
la signification de l’optimalité des deux 
fonctionnelles J,, J,. Autrement dit, le 
point qui correspond à un processus 
optimal doit nécessairement être situé 

Fio. 44 sur la frontière de l’ensemble D. Cepen- 

ë ‘ dant, il serait faux de croire que chaque 

point frontière de l’ensemble D satisfait 

à cette condition nécessaire (voir, par exemple, le point À de la fig. 13). La 

fig. 14 représente les points C1, C2, C3 qui satisfont à la condition nécessaire 
énoncée ci-dessus. 

Maintenant, l’idée consiste à prendre la condition nécessaire d’'optimalité, 
énoncée plus haut, pour définition de l’optimalité (pour le cas de deux 
fonctionnelles J,, J,). Autrement dit, nous considérons maintenant la spécifi- 
cation suivante du problème de maximisation de deux fonctionnelles J,, J.. 
Soit (3.1), (3.2) un certain processus admissible (pour l’objet discret commandé 
en question) donnant aux fonctionnelles considérées les valeurs J*, J#; ce pro- 
cessus sera considéré comme optimal s’il n’existe pas de processus admissible 
pour lequel J, > JŸ, J, > JŸ, l’une de ces inégalités au moins étant stricte. 

Du point de vue géométrique, cela signifie que l’angle droit de sommet au 
point C = (JŸ, JS), dont les côtés sont parallèles aux demi-axes positifs de 
coordonnées, ne contient aucun point de l’ensemble D différant du point C. 
La fig. 14 nous montre que pour cette interprétation de l’optimalité (contraire- 
ment aux précédentes), nous aurons en règle générale un nombre infini 
de processus optimaux pour l’objet discret commandé en question. 

Une définition analogue peut être énoncée également dans le cas où l’on 
considère 4 fonctionnelles (5.1). A savoir, le processus admissible (3.1), (3.2) 


qui donne aux fonctionnelles (5.1) les valeurs JF, JE, ..., J k est considéré 
comme optimal s'il n’existe pas de processus admissible pour lequel J, > J*, 


Ji Ji; ass di JË, une de ces inégalités au moins étant stricte. Autre- 
ment dit, le processus est optimal s’il est impossible d'augmenter la valeur d’une 
des fonctionnelles (5.1) sans diminuer en même temps les valeurs des autres 
fonctionnelles. 

Cette interprétation de l’optimalité possède la même description géométri- 
que que dans le cas k = 2, sauf qu'il faut considérer, à la place de l’angle droit 
de sommet (J*, J#), un angle solide dans l’espace de dimension k, angle formé 
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de tous les points (J1, J2, ..., J,) qui satisfont aux conditions J, > J?, J, > 


Jos ases di JR. La fig. 15 représente le cas 4 = 3. 

Montrons maintenant que, pour cette interprétation de l’optimalité, le 
problème de la recherche des processus optimaux se ramène (dans un certain 
sens) aux problèmes considérés au n° 3. Pour simplifier, nous nous limiterons à 
nouveau au Cas 4 — 2 et nous supposerons que l’ensemble D est convexe 
(fig. 16). Soit (3.1), (3.2) un processus optimal tel que le point correspondant 





Fig. 15 


À = (JŸ, J$) soit situé sur la frontière de l’ensemble D, l’angle droit de som- 
met À et dont les côtés sont parallèles aux demi-axes positifs de coordonnées 
ne possèdant pas de point commun avec D, autre que À, 

Désignons cet angle droit par K. Il existe alors une droite T qui passe par 
le point À et qui sépare l’ensemble D de l'angle K. Désignons par n = (B,, B.) 
le vecteur orthogonal à la droite [' et dirigé 
vers l’angle X. Alors la fonction 


F(J:, Jo) — B11 + Boy 2s (5.4) 


considérée dans le plan des variables J,, J, 
prend sur la droite T une valeur constante 
égale à cette fonction au point À, et dans 
tous les autres points de l’ensemble D cette 
fonction prend des valeurs plus peti- 
tes. Ainsi, la fonction (5.4), restreinte 
à l'ensemble D, atteint son maximum au 
point À. Autrement dit, le processus admies- 
sible considéré (3.1), (3.2) (auquel corres- 
pond le point A) maximise la fonctionnelle Fig. 16 

(9.4). Ceci étant, les nombres B, et $, sont 

non négatifs, puisque le vecteur n 

est à l’intérieur de l'angle À (ou est dirigé le long d’un de ses côtés). 

Par conséquent, la signification du concept d’optimalité considéré est en 
fin de compte équivalente à l’optimalité dans le sens du maximum d’une fonc- 
tionnelle (5.4) pour certains nombres non négatifs B,, B,. Une assertion ana- 
logue est vraie pour un plus grand nombre de fonctionnelles. 

Nous pouvons conclure en disant que les problèmes considérés au n° 3 sont 
les problèmes fondamentaux, car un grand nombre de problèmes de commande 
optimale des objets discrets, en particulier ceux considérés aux n95 4, 5, se ramè- 
nent à ces problèmes. 
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$ 2. Relations entre les problèmes d’optimisation 
discrète et les autres problèmes d’extrémum 


6. Extrémums des fonctions. Nous étudierons dans cette section 
les relations qui existent entre le problème de commande optimale 
des objets discrets, posé au $ 1, et le problème classique de l’extré- 
mum (i.e. du maximum ou du minimum) d’une fonction. 

Considérons une fonction f à valeurs réelles définie sur l’ensem- 
ble AZ (ou, comme on dit aussi, possédant l’ensemble M comme 
ensemble de définition). Cela signifie que l’on fait correspondre à 
chaque point a € M un certain nombre f (a), appelé valeur de ia 
fonction f au point a. 

Le point x, € M s'appelle point de minimum de la fonction f 
si pour tout point x € M on a l'inégalité f (x) > f (xs). Si x, est un 
point de minimum de la fonction f, la valeur correspondante f (x,) 
s'appelle valeur minimale (ou minimum) de la fonction f. 

Pour écrire la valeur minimale de la fonction f, on emploie la 
notation 

min j (x). (6.1) 
xE M 


Ainsi, le symbole (6.1) se définit par les deux conditions suivantes : 
1) f (x) > min f (x), quel que soit x€ M; 
M 


xE 
2) il existe un point x, € M tel que f (x9) = min f (x). 


On définit d’une manière analogue le maximum d’une fonc- 
tion ; remarquons que le problème de la recherche du maximum de 
la fonction f est équivalent au problème de la recherche du mini- 
mum de la fonction — f. 

Le problème de la recherche de l’extremum des fonctions ainsi 
posé est bien trop général et donc, en règle générale, on impose des 
contraintes à la fonction f et à son domaine de définition. De nom- 
breux chapitres et même des théories mathématiques modernes sont 
entièrement consacrés à la solution du problème de l’extremum des 
fonctions sujettes à telle ou telle contrainte. En guise d’exemple, 
citons de nombreux chapitres d'analyse qui se rapportent à divers 
types de problèmes d’extremum, ainsi que le calcul des variations, 
la programmation linéaire, la théorie des jeux, etc. 

La théorie mathématique de commande optimale d'objets dis- 
crets est aussi entièrement liée à la considération d’une classe spé- 
ciale de problèmes d’extremums de fonctions. Plus particulièrement, 
nous montrerons ici que Le problème de commande optimale d'un 
objet discret est équivalent au problème de l’extremum d'une 
fonction définie sur un certain sous-ensemble de l’espace euclidien. 
Autrement dit, nous montrerons que chaque problème de l’extremum 
d’une fonction peut être reformulé comme un problème de commande 
optimale d’un certain objet discret (d’ailleurs de forme très spé- 
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Ciale) et, inversement, chaque problème de commande optimale 
d'un objet discret se réduit au problème de l’extremum d’une cer- 
taine fonction. 

Ainsi, supposons donné un problème d’extremum (mettons, pour 
préciser, de maximum) d’une fonction définie sur un sous- 
ensemble de l’espace euclidien, i.e. supposons donné dans l’espace 
E” de dimension n des variables zl, ..., z* un ensemble Q sur 
lequel est définie une fonction F (z) = F (z!, ..., z"); on se pro- 
pose de trouver un point z, = (2, ..., 25) € Q où la fonction F 
atteint sa valeur maximale (sur l’ensemble Q). 

Considérons £”" comme l’espace de phase d’un objet discret com- 
mandé et posons V — 1. Dans ce cas (i.e. pour VN — 1), le problème 
de commande optimale d’un objet discret (à extrémité gauche fixée 
et à extrémité droite libre) se décrit de la manière suivante. On se 
donne un certain point initial x (0) — x, et un certain ensemble 
ÜU = U, (x (0)). La trajectoire consiste, en plus de x (0), en un seul 
point x (1), défini par la relation (cf. (3.8), (3.4)) 


x (1) = fi (x (0), u (1)), où u (1) € U. (6.2) 


En outre, on se donne une fonction f{ (x (0), w (1)). Il s’agit de trou- 
ver une commande (i.e. un point uw (1) € U) tel que la fonctionnelle 


J = fi (x (0), u(1)) (6.3) 


(cf. (3.5)) prenne sa valeur maximale. 
Posons maintenant 


U=Q, fi(r,u)=u, f(x, u)=F(u). 


Alors, le problème discret de commande optimale décrit par les 
relations (6.2), (6.3) prend la forme suivante: la trajectoire de l’objet 
étant décrite par l’équation x (1) = uw (1), il faut choisir un point 
u (1) E Q pour lequel la fonctionnelle J = F (u (1)) prend la valeur 
maximale. Ici les expressions x (0), x (1) ne jouent aucun rôle, i.e. 
nous nous sommes en fait posé le problème suivant: trouver un 
point uw (1)E Q, tel que J — F (u (1)) soit maximal. Mais cela 
est évidemment le problème initial de maximum de la fonction 
F (z) sur l’ensemble Q. 

Ainsi, chaque problème d’extremum d’une fonction définie 
sur un sous-ensemble de l’espace euclidien peut être reformulé (et 
d’ailleurs trivialement) sous forme de problème de commande opti- 
male d’un objet discret. Il va de soi qu’il existe d’autres moyens 
pour récrire le problème d’extremum d’une fonction sous forme 
de problème de commande optimale d’un objet discret. 

Ainsi, dans les exemples 1.1, 1.2 nous avions construit d’une 
autre manière l’objet discret commandé en prenant pour point de 
départ le problème de maximum de la fonction F (z!, z?, ... 

..…, 2) = 217? ,..z" donnée sur l’ensemble Q défini par les 
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inégalités z1>0,...,2>0,zt+...+7t< a. En effet, par 
la méthode considérée, nous avons obtenu un objet discret dans un 
espace de phase de dimension deux (dans l’exemple 1.1) ou de dimen- 
Sion unité (dans l’exemple 1.2), pour lequel r = 1, N = n; par la 
méthode que nous venons de décrire, au contraire, nous obtiendrons 
à partir de ce même problème de maximisation d’une fonction un 
objet discret pour lequel r = n, N — 1. Nous pouvons proposer 
encore d’autres méthodes qui réduisent ce même problème à celui 
de commande optimale d’un objet discret. La même chose se rap- 
porte à tout autre problème d’extremum d’une fonction. 
Réciproquement, supposons donné un problème de commande 
optimale d’un objet discret. Prenons le plus général des problèmes 
considérés au n° 3: l’objet commandé se décrit par les relations 
(3.3), (3.4), et il s'agit de choisir un point initial x (0) € M, et une 
commande (3.1), de sorte que la trajectoire correspondante (3.2) 
satisfasse aux conditions x (£) € M},, t — 1, 2, ..., N, la fonc- 
tionnelle (3.5) prenant sa valeur maximale. Rappelons que U; (x) 
est un sous-ensemble de l’espace de dimension r des variables u}, 
se 
_ Introduisons de nouvelles variables, que nous désignerons par 
Hi Seb. . OÙ Li. an jt: sure S=Û0, L..:,:N: 
ne — 1,2, ..., N. Ainsi, le nombre de ces variables est égal à 4 — 
n (N + 1) + rN. L'espace dont les coordonnées sont toutes ces 


Le sera désigné par Æ*. Soit z — (ui, x) un point de cet 
espace. Alors, pour tout s — 0, 1, , N, nous pouvons consi- 
dérer un point de l’espace Æ£7 qui a pour coordonnées les nombres 
xs, . . ., &$ , désignons-le par Ë, (z). De la même manière nous pou- 
vous considérer (pour tout £ = 1, ..., N) le point de l’espace des 
variables ul, ..., u” qui a pour coordonnées les nombres uk, ... 

., uf; désignons-le par n; (z). Ecrivons maintenant le système 
de relations: 


EDEM,s=0,1,..., N: (6.4) 
M(z)E Ur (Ë1(2)), t=1,..., NW); (6.5) 
(2) = fé), nm), 1=1,...,N. (6.6) 


L'ensemble de tous les points z € Æ* qui satisfont aux relations (6.4) 
à (6.6) sera désigné par Q; ainsi QC E". Ensuite, définissons la 
fonction # (z) (que nous supposerons définie seulement sur l’en- 
semble Q) en posant 


F(z)= fi (6 (2), M1 (2)) + f2 (Ei(2), ne (2)) + 
. nr (Erv1 (z), UE (z)), (6.7) 


et considérons le problème de la recherche du maximum de cette 
fonction sur l’ensemble Q. Nous montrerons que ce problème est 
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équivalent au problème de commande optimale de l’objet discret 
considéré ci-dessus. 

En effet, soit x (0) € M, un point initial, (3.1) une commande 
admissible (relativement à ce point initial) et (3.2) la trajectoire 
correspondante de l’objet discret commandé considéré. Loue par 


24, ..., ds les coordonnées du point zx (s) (s = 0, 1, ss AN): 
et par u}, ..., u; les coordonnées du point u @) = + AN}: 
Alors nous obtiendrons une suite de nombres x, u? pour oi les dE 
oies mir, sr: s—=0,1,.,.: N;t=T, 


, IV, i.e. nous on un certain point z — — (ui, + e 
l’ espace E*, Il est clair que ce point z satisfait aux relations 


= rs =0; LUN: | 
nm )=u(t), t = 1, N 


(et se définit univoquement par ces relations). [1 découle de (3.3), 
(3.4) et des relations x (1) € M;,, t = 0, 1, ..., N, que le point z 
satisfait aux relations (6.4) à (6.6). 

Réciproquement, si z est un point quelconque de l’ensemble Q, 
alors, en construisant les points (3.2), (3.1) d’après les formules (6.8), 
nous obtiendrons (en vertu des relations (6.4) à (6.6) que (3.2), (3.1) 
sont la trajectoire et la commande qui satisfont aux relations (3.3), 
(3.4) et aux inclusions x (4) E M;,, t — 0, 1, ..., N. Ainsi, les 
relations (6.8) définissent une bijection entre les points de l’en- 
semble Q et les processus admissibles pour l’objet discret considéré 
(i.e. Les processus (3.1), (3.2) qui satisfont aux relations (3.3), (3.4) 
et aux inclusions x (4) € M;,, t — 0, 1, ..., N). Ensuite, d’après 
(6.8), la valeur de la fonction F au point 2€ Q (cf. (6.7)) est égale 
à la valeur de la fonctionnelle J (voir (3.5)) pour le processus qui 
correspond au point z. On en déduit en particulier que les points de 
raaximum de la fonction F sur l’ensemble Q correspondent, d’après 
(6.8), aux processus optimaux de l’objet discret considéré. 

Ainsi, le problème de la recherche des processus optimaux dans 
le système discret considéré est équivalent *) au problème 
de la recherche des points de maximum de la fonction F (z) construite. 


(6.8) 


*) On aurait pu, bien entendu, réduire le problème de l'optimisation des 
processus discrets au problème du minimum d’une certaine fonction bien plus 
simplement. Il était suffisant de désigner par Q* l’ensemble de tous les pro- 
cessus admissibles (3.1), (3.2) (i.e. satisfaisant aux relations (3.3), (3.4)) et 
considérer la fonction J définie sur l’ensemble Q* par l'égalité (3.5); alors la 
recherche des points de maximum de la fonction J définie sur l’ensemble Q 
signifierait, par définition, la recherche des processus optimaux pour l’objet 
discret considéré. Néanmoins, la réduction effectuée ci-dessus est intéressante 
par le fait qu’elle réduit le problème de l’optimisation des processus discrets 
non pas au maximum d’une fonction définie sur un ensemble quelconque 
donné d’une manière abstraite, mais au maximum d’une fonction définie sur 
un certain sous-ensemble de l'espace euclidien. 
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L’équivalence des problèmes considérés pose naturellement la 
question suivante: est-il vraiment nécessaire de construire une 
théorie indépendante des processus optimaux pour les systèmes dis- 
crets? Ne serait-il pas préférable de mettre ici un point final en 
disant que le problème de la recherche des processus optimaux 
des systèmes discrets est ainsi réduit au problème de l’extremum 
d’une fonction définie sur un sous-ensemble de l’espace euclidien, 
et qu’à son tour celui-ci est étudié, par exemple, dans la théorie de 
programmation mathématique? Un tel point de vue est tout à fait 
justifié ; de toute façon, on peut considérer la théorie des processus 
optimaux des systèmes discrets comme un chapitre de la 
théorie des extremums des fonctions. 

Mais il importe peu de savoir si telle théorie est subordonnée à 
telle autre. Quoique le problème fondamental de la théorie mathé- 
matique des processus optimaux des systèmes discrets se ré duise 
au problème de l’extremum d’une fonction définie dans un sous- 
ensemble de l’espace euclidien, il reste néanmoins vrai que le pro- 
blème de l’optimisation des processus discrets possède certaines pro- 
priétés particulières. En effet, le système de relations (6.4) à (6.7) 
qui définit l’ensemble Q & ÆE* ainsi que la fonction F (z) qui y est 


définie est très spécifique (par exemple, chacune des variables u 
ne participe pas à plus de deu x *) des 8N + 1 relations (6.4) à 
(6.6) qui déterminent l’ensemble Q sur lequel se définit la fonc- 
tion F, quoique le nombre NV puisse être très grand, tandis que cha- 
cune des variables x ne participe qu'à quatre au plus de ces 
relations). On peut donc s'attendre à ce que les conditions nécessaires 
et suffisantes d’optimalité s’énonceront d’une manière plus spéci- 
fique que les théorèmes généraux qui expriment les critères 
d’extremum des fonctions. Ces considérations justifient l’existence 
d’un objet d'étude propre à la théorie mathématique de la commande 
optimale des systèmes discrets. 

II va de soi qu’en vertu de la réduction effectuée dans cette sec- 
tion, on pourrait formuler les résultats spécifiques ainsi obtenus en 
termes d’extremums de fonctions (i.e. si le domaine de définition 
et la fonction elle-même ont telle ou telle forme, alors certaines 
conditions précises d’extremum sont satisfaites). Néanmoins, ceci 
n’est pas avantageux, car de nombreuses applications pratiques 
(cf. n° 2) posent justement le problème pour des objets commandés 
passant successivement d’un état à l’autre. De plus, les processus 


*) Si l’on écrit les relations (6.4) à (6.6) en coordonnées, on verra que cha- 
cune des variables u?, x; participe à un plus grand nombre de relations, mais dans 
ce cas le rapport du nombre de relations contenant la variable considérée 
au nombre total de relations sera à peu près le même. Par exemple, si l’on écrit 
(6.6) en coordonnées, on obtient nN relations, parmi lesquelles pas plus de 


n + 1 contiennent la variable 2. 
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discrets commandés apparaissent également dans des problèmes 
mathématiques, par exemple, dans la méthode permettant d'obtenir 
une variante discrète, donc simplifiée, du problème de commande 
optimale d’un processus continu (nous reviendrons plus tard à cette 
question). 

Tout ceci nous montre que le problème de la commande optimale 
discrète diffère du problème de l’extremum d'une fonction non seu- 
lement par la forme de son énoncé, mais aussi par son caractère spé- 
cifique, engendrant une branche autonome des mathématiques. 

7. Le problème de programmation mathématique. Comme nous 
avons vu au n° 6, le problème de la commande optimale des objets 
discrets se réduit au problème de l’extremum d’une fonction, définie 
sur un certain sous-ensemble Q de l’espace euclidien, ce qui restreint 
considérablement la classe des problèmes d’extremum à considérer. 
Néanmoins, même sous cette forme, le problème est trop général, 
et pour obtenir des résultats significatifs, il faut imposer des con- 
traintes à l’ensemble Q et la fonction qui y est définie. 

On rencontre le plus souvent le cas où l’ensemble Q est défini 
dans l’espace euclidien par un système d’égalités et d’'inégalités, tan- 
dis que la fonction considérée sur cet ensemble (dont on recherche 
l'extremum) est régulière. Plus précisément, cela signifie que nous 
avons le problème suivant. 

Dans l’espace euclidien £” des variables z!, . .., z" nous avons 
les fonctions 


PC) = CS Lam) 
FM) = FM, ..., 29, ..., Fo = Fa, ..., ), 
De CS Lis 2) D Or sea 2, 


que l’on suppose régulières, i.e. possédant des dérivées continues 
relativement à tous leurs arguments. D'autre part, l’ensemble Q 
se définit comme l’ensemble de tous les points z € £" qui satisfont 
au système de relations 


F1(2) =0,..., F*(z) = 0, (7.1) 
g )<0,..., g° (2) < 0. (7.2) 


our cet ensemble Q@ on considère la fonction F° (z) et l’on pose le 
problème de la recherche du maximum (ou du minimum) de cette 
fonction sur l’ensemble Q. Le problème ainsi énoncé s'appelle pro- 
blème de programmation mathématique. 

Pour le problème ainsi posé, un grand nombre de conditions 
d’extremum, aussi bien nécessaires que suffisantes, ont été éla- 
borées. Cela permet, conformément à ce qui a été dit au n° 6, d’ob- 
tenir une série de critères d’optimalité pour les processus discrets. 

Disons maintenant quelques mots sur la signification des rela- 
tions (7.1). L'équation F1 (z) — 0 définit une surface de dimension 
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n — À (ou, autrement, une hypersurface) dans l’espace £” de dimen- 
sion n. Ainsi, pour n — 2 l'équation F1 (z!, z?) — 0 définit une 
courbe dans le plan Æ? des variables z!, z°. Pour n — 83 l’équation 
F1 (21, 22, z$) — 0 définit une surface (de dimension deux) dans l’es- 
pace Æ* à trois dimensions. Il en est de même de chacune des équa- 
tions (7.1). L'ensemble défini par le système d’équations (7.1) 
consiste donc en des points qui appartiennent à chacune des 
hypersurfaces #1 (z) — 0, ..., FF (z) — 0, i.e. cet ensemble est 
l'intersection de toutes les hypersurfaces indiquées. Par exemple, 





Fig. 17 Fig. 18 


pour n — 3, les deux équations FT (z) — 0, F?(z) — O définis- 
sent l’intersection de deux surfaces, i.e. une ligne courbe dans l’es- 
pace Æ% à trois dimensions (fig. 17). Dans le cas général, il faut se 
représenter que les équations (7.1) définissent dans l’espace E" à 
n dimensions l'intersection de 4 hypersurfaces, i.e. définissent une 
surface de dimension n — k dans Æ7. 

Venons-en maintenant à la signification des inégalités (7.2). 
L'équation g!'(z) — 0 définit, comme nous l'avons dit, une 
certaine hypersurface dans Æ£*. Cette hypersurface partage l’espace 
ET en deux domaines: dans l’un d’entre eux on a l'inégalité g! (z) >= 
> 0 et dans l’autre, l'inégalité g! (z) 0. Aïnsi, l'inégalité g! (z) < 
< 0 définit un domaine fermé dans E* qui contient les points du 
domaine gl (z) 0 et les points de l’hypersurface gl (z) — O0 qui 
le limite. 

Considérons, par exemple, le domaine fermé défini dans le plan Æ£? 
des variables zl, z? par l'inégalité g (z) < 0, où g (z) — (z!}? + 
+ (22)? — 1. Cette inégalité définit un cercle unité fermé (fig. 18); 
pour les points à l’intérieur de ce cercle nous avons l'inégalité 
g (z) < 0 et sur la circonférence qui le limite, l'égalité g (z) = 0, 
tandis que pour les points extérieurs g (z) > 0. 

Ainsi, chacune des inégalités (7.2) définit un domaine fermé 
de E". Quant à l’ensemble défini par toutes les inégalités 
(7.2) il consiste en des points appartenant à chacun des domaines 
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fermés gl (z) < 0, ..., g° (z)<O, i.e. cet ensemble est l’intersection 
de tous les domaines fermés indiqués. 

Enfin, l’ensemble défini par le système de toutes les relations 
(7.1), (7.2) est l’intersection de la surface (7.1) et de l’ensemble dé- 
fini par les inégalités (7.2). On peut s’imaginer cet ensemble défini 
par le système de relations (7.1), (7.2) comme un « polyèdre déformé » 
de dimension n — k. 





Fig. 21 Fig. 22 


Soient, par exemple, n — 3 et 4 — 1. Alors, nous avons une 
seule équation 


(52%) 0 (7.3) 
(cf. (7.4)), qui définit une surface dans Æ* (fig. 19). En ajou- 
tant à (7.3) la seule ïinégalité g! (2, z?, z) < 0, nous obtien- 
drons un domaine fermé sur cette surface (fig. 20), dans lequel la 


deuxième inégalité découpera encore un « morceau » (fig. 21), etc. 
Enfin, le système d’inégalités tout entier 


bars) ess Dr 22) 0 
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définira sur la surface (7.3) un certain « polygone déformé » (i.e. 
un « polyèdre déformé » de dimension deux; (fig. 22). 

La recherche des points de minimum (ou de maximum) de la 
fonction FÆ° (z) définie sur le « polyèdre déformé » (7.1), (7.2) peut 
être effectuée par les méthodes classiques. Considérons un exemple 
simple. 

Exemple 7.1. Trouver le minimum de la fonction 


F = ap — hay? — Dry + Bay + À «+ — 4x +3, (7.4) 


2 (fig. 23). 
défini la fonction 
x, 3? — y par les 


considérée sur le rectangle —1<x<3, 0<y< 
Solution. Ici l’ensemble Q sur lequel on a 
F est donné dans le plan £E? des variables z! — 
inégalités 
7 —1<0,z13< 0, 
—Z% LO, 7% —2<LO0, (7.5) 


i.e. les équations (7.1) sont 
totalement absentes, tandis que 
les inégalités (7.2) sont de la 
forme (7.5). 

Supposons tout d’abord que 
le point de minimum cherché 
est situé à l’intérieur du rec- 
tangle considéré. Dans ce cas, on 
doit avoir la condition néces- 
saire d’extremum classique 
d'analyse: les dérivées partielles de la fonction F relativement 
à æ et y doivent s’annuler en ce point. En calculant les dérivées 
partielles et en les posant égales à zéro, nous obtenons le système: 


F, = 2xy? — 4xy — 4y? + By + 2x? + 2x — 4 — 0, (1.6 
F, = 22°y — 22? — 8xy + 8x = 2x (x — 4) (y —1) = 0.) 


La deuxième des relations (7.6) peut être vérifiée à l’intérieur du 
rectangle considéré pour y = À ou pour x = 0. Dans le premier cas 
(y = 1), on déduit de la première équation (7.6) que x = 0. Dans 
le deuxième cas (x — 0), on déduit de la première équation (7.6) 
que y — 1. Ainsi, à l’intérieur du rectangle, il n’y a qu’un seul 
point où les deux dérivées F,, F, s'’annulent simultanément, à 
savoir le point (0, 1). Autrement dit, parmi les points intérieurs 
du rectangle, seul le point (0, 1) peut être un point de minimum. 

Mais il est possible que la fonction F atteigne son minimum sur 
la frontière du rectangle. Considérons d’abord le côté du rectangle 
défini par les relations x = —1, 0 < y < 2. Substituant dans (7.4) 
la valeur de x = —1, nous trouvons que sur ce côté la fonction F 





Fig. 23 


$ 2 PROBLÈMES D'OPTIMISATION DISCRÈTE ET D’EXTRÉMUM 49 


est de la forme suivante: 


22 
F1 =59ÿ— 10y + =. (7.7) 


Supposons que la fonction F atteigne son minimum en un certain 
point M, du côté considéré. Dans ce cas, pour tout point A7 du rec- 
tangle, on doit avoir l'inégalité F (M) > F (M5). En particulier, 
cette inégalité doit être vérifiée pour tout point M situé sur le côté 
considéré ; autrement dit, la fonction F, restreinte au segment x — 
= —14, 0<Ly<L2 (i.e. la fonction (7.7)), doit atteindre son mini- 
mum au point M,. Si le minimum est atteint dans un point inté- 
rieur de ce segment, alors la dérivée de la fonction (7.7) doit s’annu- 
ler dans ce point, i.e. la relation 40y — 10 = O,ou doit être vérifiée 
y = À. Ainsi, (—1, 1) est le seul point intérieur du côté x = —1, 
0<y<2 dans lequel la fonction F peut probablement 
atteindre son minimum. 

Des considérations analogues, appliquées aux autres côtés du 
rectangle, nous donnent encore trois points de minimum possible: 
(3, 1), (1, O0), (1, 2). 

Enfin, il est possible que la fonction F atteigne son mini- 
mum dans un des sommets du rectangle considéré, i.e. dans un des 
points (—1, 0), (3,0), (—1, 2), (3, 2). 

Ainsi, nous n'avons que neuf points (fig. 28) dans lesquels la 
fonction F peut atteindre son minimum. Pour trouver le vrai 
point de minimum, il suffit maintenant de calculer les valeurs de 
la fonction F dans ces neuf points et d’en choisir la plus petite. Un 
calcul direct montre que les plus petites valeurs de la fonction 
dans ces points sont F (1, 0) — 2/3 et F (1, 2) = 2/3. Ainsi, la 
fonction F atteint son minimum aux deux points (1, 0), (1, 2) et ce 
minimum est égal à 2/3. 

La méthode appliquée pour résoudre l'exemple 7.1 peut aussi 
être généralisée au cas général. Supposons qu'il s’agit de trouver 
le minimum de la fonction F° (z), définie sur l’ensemble Q, décrit 
par les relations (7.1), (7.2). 

Prenons un point intérieur quelconque z, = (2, %, ... 
..., 20) du « polyèdre » @, i.e. un point qui satisfait à toutes les 
relations (7.1), (7.2) les inégalités strictes ayant lieu dans les 
relations (7.2) (fig.24). Pour que la fonction F0 atteigne son minimum 
au point z, il est nécessaire que les dérivées partielles de la fonction 
F9 s’annulent dans toutes les directions tangentes au « polyèdre » 
Q (voir fig. 24). Ceci donne n — k égalités (puisque le « polyèdre » 
2 est de dimension nr — k). En outre, nous avons encore k égalités 
(7.1) (vérifiées au point z, car z0 € Q). Nous obtenons donc n éga- 
lités, qui donnent la condition nécessaire pour que la fonction F (z) 
atteigne son minimum dans un point intérieur du «po- 
lyèdre » Q.Cette condition nécessaire est un système de n équations à 


k—01208 
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n inconnues Z,, 25, . .., 20 de sorte que (en règle générale) il n’y 
aura à l’intérieur de Q qu’un nombre fini de points dans lesquels 
la fonction F° (z) peut atteindre son minimum. 

Admettons maintenant qu’au point z, € @ une des relations 


(7.2) se transforme en égalité et Les autres inégalités restent strictes. 





Fig. 24 


Par exemple, g!(2,) = 0, g°? (20) < 0, ..., g° (20) < 0. Alors le 
point z, satisfait aux relations 
Fr (2) = 0,..., F*(z) — 0, g' (2) = 0; 
D) LOL, ECO: (7.8) 
Ces relations définissent un « polyèdre déformé » Q’ de dimensions 
n — (k + 1) = (n — k) — À (i.e. de dimension inférieure de l'unité 
à celle de Q), qui est la face du « polyèdre déformé » Q (fig. 25). 





Fig. 25 


Il est clair que z, est un pointintérieur du polyèdre Q’ (puis- 
que les relations (7.8) sont des inégalités strictes au point 2). 
Par conséquent, nous pouvons écrire d’une manière analogue la 
condition nécessaire du minimum au point Zz,; cette condition con- 
tient n équations relativement aux coordonnées 2, 25, ..., z, du 
point z,. Il en découle que sur la face Q” il y aura également un 
nombre fini de points dans lesquels il peut y avoir un minimum. 
Une situation analogue a également lieu sur les faces de plus 
petite dimension. En fin de compte nous obtenons (à l’intérieur du 
« polyèdre » et sur toutes ses faces) un nombre fini de points dans 
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lesquels il peut y avoir un minimum. Il reste à comparer les valeurs 
de la fonction F dans ces points et de choisir la plus petite *). 

En général, la méthode décrite devient particulièrement ennuyeu- 
se si le «polyèdre» considéré a beaucoup de faces. Puisque le 
nombre de faces du polyèdre va en croissant lorsqu'on augmente n 
(i.e. le nombre des variables zl, z?, . .., z"), la méthode devient de 
plus en plus encombrante. Par exemple, on peut facilement calculer 
que le parallélépipède de dimension n, i.e. le polyèdre, défini dans 
l’espace Æ£”" par les inégalités 


ÉD EURE PEP.. LL AT EZ EU. 


possède 3° — 1 faces (de toutes les dimensions 0, 1, ..., n — 1). 
Déjà pour n — 4, nous avons 80 faces et chacune d’elles nécessite 
un calcul spécial pour rechercher les points où il peut y avoir un 
minimum. Par conséquent, la méthode décrite plus haut (qui exige 
la considération séparée de chacune des faces du « polyèdre déformé » 
et qui est dans une certaine mesure « artisanale ») est rarement em- 
ployée; on emploie à sa place, en programmation mathématique, 
d’autres méthodes (voir $ 3). 

8. Processus commandés à temps continu. La programmation 
mathématique est une des sources des critères d’optimalité pour 
les objets commandés discrets. Nous considérerons ici encore une 
source qui donne des théorèmes sur les objets commandés discrets, 
à savoir le problème de la commande optimale des processus no n 
discrets, i.e. des processus à temps continu. Ce problème est 
intéressant pour deux raisons. Premièrement, les résultats de la 
théorie de la commande optimale des objets continus permettent 
d'énoncer par analogie des «théorèmes ressemblants » 
concernant les objets discrets (voir plus loin le n° 10). Aïnsi, la 
théorie de la commande optimale des objets continus représente 
pour la théorie des objets commandés discrets une méthode heuristi- 
que importante qui indique certaines directions de recherches et 
permet de prédire le caractère des résultats. Deuxièmement, la 
liaison entre les objets commandés discrets et continus permettant 
de considérer les objets continus comme « cas limite » des objets 
discrets est importante par elle-même: par exemple, comme méthode 
de description approchée des processus commandés continus (plus 
compliqués en général) par les processus discrets (ou comme mé- 


*) Strictement parlant, la méthode décrite garantit que l’on obtient un 
minimum seulement dans le cas où l’on sait a priori qu’il existe. Néanmoins, 
dans l'hypothèse (admise implicitement ci-dessus) que la fonction F est diffé- 
rentiable (et donc continue), et l'hypothèse, elle aussi admise implicitement, 
que le « polyèdre » considéré est un ensemble fermé borné, la fonction F atteint 
nécessairement son minimum sur ce « polyèdre », et la méthode décrite est 
applicable. 


4% 
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thode de description approchée des processus discrets par les proces- 


sus continus). 
Exemple 8.1. Considérons l’objet commandé discret de 


l'exemple 1.2 et effectuons un passage à la limite à un objet com- 
mandé continu. Ainsi, nous considérons un objet discret décrit par 


les relations 


x (D = xt (t — 1) + u (r), (8.1) 
u () EU, (8.2) 
xl (0) = 0, z'(N)E M, (8.3) 


où U — (0, æ), M, = [0, al et, pour cet objet, posons le problème 
de la recherche d’un processus qui donne la valeur maximale de la 
fonctionnelle 


J — ÿ In u (f). (8.4) 
t=1 


Supposons que V est «grand » (mettons N = 50 ou plus) et que 
nous avons eu l’idée de représenter graphiquement le com- 
portement de la commande 


u (1), uw (2), ..., u (N) (8.5) 
et de la trajectoire correspondante 
xt (0), xt (4), ..., xt (NW). (8.6) 


Puisque NW est grand, la représentation graphique dans une échelle 
du temps usuelle est peu commode. Il est donc naturel de choisir 
un certain « pas » k et d'introduire à la place de # un nouvel argu- 
ment T suivant la formule 


Tu t=0 LL :.4 N (8.7) 
Ainsi, t prendra les valeurs 0, h, 2h, ..., Nh. Précisons le choix 
du pas À de la façon suivante: 
a 
h=—+ (8.8) 


(de sorte que pour un grand N le pas À sera petit). 
Introduisons de nouvelles variables y!, v qui dépendent de l’ar- 


gument t suivant les formules: 
T { 


1 
g'(n=at (+) =at (rs), v(D= ru (—)=-u(. (82) 
Pour ces nouvelles variables la relation (8.1) se mettra sous la for- 
me (prenant en considération que y! (Tt— h) = x! (=) — 
a à 7 (= — 1) ar (t—1): 
y (t) = y (t — h) + hv (r), 
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oÙU ; : 
y (T)— y! (T—h) 


Ici le premier membre contient une expression dont la limite pour 
hk — 0 est la dérivée dyl/dr (c’est justement dans ce but que 
nous avons introduit dans le deuxième membre de la seconde for- 
mule (8.9) le facteur 1/h). D'autre part, les relations (8.2), (8.3) 
prendront, en passant aux nouvelles variables, la forme 


v (T) EU, (8.11) 
y! (0) = 0, y! (a)E M, (8.12) 


(car, en vertu de (8.8) et (8.9), nous avons y! (a) = x! (a/h) = x! (N)), 
où on a toujours U — (0, æ), M, = [0, al. Enfin, la fonctionnelle 
(8.4) se récrira sous la forme 


N 
J= > nu(t)= >, In hv(r)— 
= 


=Ninh+Snv(=Nmk+ SAlno(r), 


la sommation dans le deuxième membre étant réalisée sur T — 
h,2h, ..., Nh. Remarquons que le terme NW In h et le facteur positif 
1/h du deuxième membre sont des constantes, et par conséquent le 
problème de maximum de la fonctionnelle J est équivalent au pro- 
blème de maximum de la fonctionnelle 


I=S hlnv(r. (8.13) 


Nous n’avons effectué ici qu’un simple changement de variables: 
Le problème du maximum de la fonctionnelle (8.13) pour l’objet 
commandé (8.10) à (8.12) à temps discret t — 0, k, 2h, ..., Nh 
ne diffère que par les notations du problème du maximum de la 
fonctionnelle (8.4) pour l’objet commandé (8.1) à (8.3) à temps dis- 
crett= 0... NN. 

Toutefois on peut donner une nouvelle signification aux formu- 
les (8.10) à (8.13). La relation (8.10) est une expression approchée 
de l'égalité 

du 

HO (0, (8.14) 
et l'expression dans le deuxième membre de (8.13) (où, rappelons-le, 
la sommation se fait sur t — k, 2h, ..., Nh et en particulier Vh — 
— à) est lasomme intégrale pour l'intégrale définie 


I*=— | Inv(x) dr. (8.15) 


0 
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On peut donc admettre que le problème discret initial de com- 
mande optimale (voir (8.1) à (8.4)) correspond approximativement 
au problème suivant relatif à la variable t non discrète 
(« continue ») qui varie sur le segment 0 LT< a. 

Il s’agit de érouver une commande v (t), i.e. une fonction définie 
sur le segment 0 < T<a à valeurs dans l'ensemble U (voir (8.11)), telle 
que la solution y (t) de l'équation différentielle (8.14) à condition 
initiale y (0) = O satisfasse à la condition finale y! (a) € M, (voir 
(8.12)), de sorte que l'intégrale I* prenne sa valeur maximale. 

C’est 1à le problème « continu » de commande optimale; au lieu 
du « temps discret » £ on considère ici la variable continue + (temps). 
Dans quel sens ces deux problèmes (discret et continu) de commande 
optimale correspondent-ils approximativement l’un à l’autre? On 
peut probablement s'attendre à ce que, pour tout processus admis- 
sible u (#), x! (£), de l’objet discret (8.1) à (8.8), il existe un processus 
admissible de l’objet commandé continu (8.14), (8.11), (8.12) qui 
lui est proche (dans le sens de la transformation (8.9)) et inversement. 

Par conséquent, si le problème continu s'avère plus sim- 
p le, alors, en le résolvant, i.e. en trouvant le processus optimal 
v (t), y! (t), nous obtiendrons à l’aide des formules (8.9) une solu- 
tion approchée du problème de commande optimale discrète 
(8.1) à (8.4) (il va de soi que, pour avoir ici non seulement une bonne 
intention mais une méthode rigoureuse pour simplifier le problème, 
il serait nécessaire de connaître l’erreur commise en remplaçant 
un problème par un autre; néanmoins, nous laisserons cette ques- 
tion de côté). 

Le problème « continu » (8.14), (8.11), (8.12), (8.15) que nous 
avons obtenu se résout simplement. Remarquons tout d’abord que 
d’après (8.14) et la première relation (8.12), nous avons: 


y! (a) = yt (0) + HO = | v (t) dt, 
0 
et, par conséquent, d’après la deuxième relation (8.12), 
| D (r) di <a. (8.16) 
0 


Servons-nous maintenant de l'inégalité In v < v — 1 satisfaite 
sur la demi-droite (0, oo), l'égalité étant vérifiée seulement au 
point v — 1 *). Par conséquent, In v (rt) < v(t)— 1 (rappelons que 


*) En effet, la fonction In v — v + 1 s’annule pour v = 1, décroit pour 
v > 4 et croît pour 0 < v < 1. 
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uv (t) > 0 en vertu de (8.11)), et par conséquent 


a 


| In v (x) dr< | (u(r) — 1)dr = | D (r) dr — a <0 
0 0 0 


(voir (8.16)), l'égalité étant vérifiée seulement pour v (rt) = 1. 

Cela donne justement la solution du problème formulé ci-dessus 
pour l’objet commandé continu: la commande optimale recherchée 
est de la forme v (tr) = 1 et elle donne à la fonctionnelle (8.15) la 
valeur Z* — 0; pour toute autre commande admissible la fonc- 
tionnelle Z* prend une valeur plus petite (i.e. négative). 

Possédant la solution exacte vw(t)=1 du problème de 
commande optimale de l’objet continu considéré, nous pou- 
vons maintenant, à l’aide des formules (8.9), obtenir une solution 
approchée du problème initial de commande optimale de 
l’objet discret : 

a 
u (£) = hu (T) =h= (—=1,2,...,N). 
Ainsi (sans toucher à la question de l’exactitude de l’approxima- 
tion obtenue), nous pouvons dire que pour le problème discret (8.1) 
à (8.3) (dans le sens du maximum de la fonctionnelle (8.4)), i.e. 
pour l’objet discret considéré dans l'exemple 1.2, la commande 


u(l)=u(2)=... =u(N)=— 


est optimale et elle est unique. Revenant au problème du maxi- 
mum du produit (exemple 1.1), nous obtenons que le produit de N 
nombres non négatifs, dont la somme est inférieure ou égale à a, atteint 
son maximum si chacun des nombres est égal à alN ; dans tout autre 
cas, le produit sera plus petit. 

Nous avons obtenu ce résultat sous forme d'approxima- 
tion à partir des considérations liées aux processus commandés 
continus. En réalité, comme nous verrons au $ 3, le résultat obtenu 
est exact. 

La réduction au problème continu de commande optimale effec- 
tuée dans l'exemple 8.1 peut être faite d’une manière analogue pour 
de nombreux problèmes discrets. On emploie néanmoins bien plus 
souvent le passage inverse : du problème continu au problème discret. 
En général, on ne parvient pas à obtenir la solution exacte du pro- 
blème continu decommande optimale et il faut chercher une solution 
approximative. Le remplacement du problème continu par un pro- 
hlème discret plussimple est un des procédés possibles de solution 
approchée. 

Voyons comment se présente, dans ses grandes lignes, la réduc- 
tion du problème continu au problème discret. Dans ce but, con- 
sidérons le problème « continu » suivant de commande optimale. 
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Soit l'équation différentielle 


da — (y, v) (8.17) 
(cf. (8.14)), dans laquelle y — (y*, y?, . .., y") est le vecteur d'état 
de phase et v — (v!, ..., v') le vecteur de commande. Ensuite, sup- 


posons fixé (dans l’espace des variables v', ..., v') un certain en- 
semble V, appelé domaine de commande, et un certain nombre positif T. 
Prenons pour commande admissible toute fonction v (rt) (continue par 
morceaux) définie sur le segment 0 << T7 < T et dont les valeurs appar- 
tiennent à l’ensemble V: 


v(T)EV (8.18) 


(cf. (8.11)). En outre, dans l’espace des variables y, . . ., y* un point 
Yo et un ensemble M, sont définis. Enfin, on connaît une fonction 
£° (y, v) qui permet de considérer, lorsque les fonctions y (x), v (rt) sont 
connues, l'intégrale définie 


T 
= | (y (r, v(v)dr (8.19) 
0 


(cf. (8.15)). ZT s’agit de trouver une commande admissible v (t) telle 
que la solution correspondante y (rt) de l'équation différentielle (8.17) 
avec condition initiale 


y (0) = Yo (8.20) 
satisfasse également à la condition finale 
y (T) EM: (8.21) 


(cf. (8.12)), de sorte que la fonctionnelle (8.19) prenne sa valeur ma- 
zimale. 

Pour effectuer la réduction de ce problème « continu » de com- 
mande optimale à un problème discret, fixons un nombre naturel W 
et posons 


T 
(cf. (8.8)). Nous conviendrons maintenant de donner à la variable 
indépendante Tt seulement les valeurs O0, hk, 2h, ..., Nh = T et 
introduisons un nouveau argument £ discret suivant la formule 


T 
+ (8.23) 


(cf. (8.7)), de sorte que { ne prendra que les valeurs 0, 1, ..., N. 
Ensuite, à la place des variables y, v, introduisons de nouvelles va- 
riables x, uw suivant les formules: 


x (8) = y (th) = y (x), u () = v (th) = v(r) (8.24) 
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(ce changement de variables diffère quelque peu de (8.9); voir à 
ce sujet la remarque 8.3 ci-dessous). 

Soient maintenant w(Tt) une commande admissible (dans le 
sens du problème « continu » considéré) et y (t) la trajectoire cor- 
respondante, i.e. la solution de l’équation différentielle (8.17) pour 
v — v(t) avec condition initiale (8.20). Aïnsi, 


D Lg (y (0), v (D). 





Cette relation peut être remplacée par l’égalité approchée 
—_y(T—h 
FOOD Le (y (0, v (9) Se (y (T2), v (D), 


que nous ne considérerons que pour les valeurs t — k, 2h, ..., Nh. 
Il en découle 


y (t) &æy(T—h) + hg (y (T— 2%), v(r)), 
ou, en vertu de (8.24), 
x () Bat — 1) + Ag (x (6 — 1), u (t)), 1 = 1, 2, ..., N. 
(8.25) 


Ensuite, l'intégrale (8.19) peut être approximativement remplacée 
par la somme intégrale: 


N N 
I & 2 hg° (y (th), v (th)) & 2 Rg0 (y(th—h), v (th)) — 


=D g0(x(t—1), u(t)). (8.26) 


Enfin, les relations (8.18), (8.20), (8.21) en vertu du changement 
de variables (8.24) se mettront sous la forme 


u (DEV, (8.27) 
x (0) = yo, x (N) € M1. (8.28) 
Désignons maintenant la fonction du deuxième membre de la 
relation (8.25) par f: 
f(x, u) = x+Rhg(x, u) 


et remplaçons (en commettant une certaine erreur) l'égalité ap- 
prochée (8.25) par l’égalité exacte: 


x =f(x(t—1), u (). (8.29) 
Remplaçons ensuite (en commettant à nouveau une certaine erreur) 


l'intégrale ZŸ* par l’expression figurant dans le deuxième membre: 
de la relation (8.26), i.e. remplaçons le problème de maximum de: 
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la fonctionelle Z* par le problème de maximum de la fonctionnelle 
N 

J=h Y, g(x(t—1), u(é)). (8.30) 
t=1 


Nous obtiendrons ainsi le problème discret de commande opti- 
male (8.29), (8.27), (8.30) à extrémité gauche fixée et à extrémité 
droite libre (voir (8.28)). En passant à ce problème à partir du problème 
continu initial, nous avons commis les erreurs suivantes: d’abord, 
nous n'avons conservé qu’un nombre fini de valeurs t = 0, k, 
2h, ..., Nh de tout le segment 0 <T<T et, deuxièmement, 





nous avons remplacé les égalités approchées (8.25), (8.26) par les 
relations (8.29), (8.30). Néanmoins, pour certaines conditions (met- 
tons, si la fonction g(y,v) est « suffisamment régulière», et le nombre À 
est « suffisamment petit », i.e. la dérivée 0g (y(r), v (t))/0y varie 
peu sur le segment de longueur k), on peut s'attendre à ce qu'il exis- 
te, pour chaque processus admissible x (t), x (t) de l’objet discret 
(8.27) à (8.30), un processus admissible de l’objet commandé con- 
tinu (8.17) à (8.21), qui lui est proche, et inversement (fig. 26). 

Ainsi, si l’on se pose le problème continu de commande opti- 
male Z* — max, sujet aux conditions (8.17) à (8.21) et si la solution 
de ce problème donne lieu à des difficultés sérieuses, alors, en pre- 
nant un certain V suffisamment grand et en passant à l’aide des 
formules (8.22) à (8.24) au problème discret (8.27) à (8.30), nous 
pouvons ensuite essayer de résoudre ce problème discret et, si l’on 
y parvient, considérer sa solution, transformée à l’aide des formu- 
les (8.24), comme étant la solution approchée du problème continu 
initial. Rigoureusement parlant pour l’application de cette méthode 
il est sans aucun doute nécessaire de posséder desestimations 
de l’erreur commise en remplaçant le problème continu par un pro- 
blème discret. 
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Remarque 8.2. Plus haut il s'agissait de l’optimalité dans le sens 
du maximum de la fonctionnelle intégrale Z* (voir (8.19)).Par conséquent. 
en passant au cas discret, nous avons également obtenu un problème de maxi- 
mum de la fonctionnelle J (voir (8.30)). Il va de soi que dans les deux cas on 
aurait pu considérer le problème du minimum (à la place du maximum) 
de la fonctionnelle correspondante (dans la théorie des processus commandés 
continus ce cas se rencontre le plus souvent: dépense minimale de carburant, 
d'électricité, d’eau de lavage, etc.). 

Remarque 8.3. La méthode de remplacement du problème continu 
par un problème discret (voir (8.24)) appliquée ci-dessus est la plus simple, 
mais non la seule possible. Souvent la forme de l’équation (8.17) peut suggérer 
une autre méthode de réduction, plus commode dans le cas concret considéré. 
Ainsi, dans l'exemple 8.1, le passage du problème discret (8.1) à (8.4) au pro- 
blème continu (que l’on aurait pu, bien entendu, effectuer en sens inverse: du 
problème continu au problème discret) peut se réaliser d’une manière diftéren- 
te: il est commode d'introduire dans la formule (8.9) le facteur 1/h. En guise 
d'exemple supplémentaire, considérons le cas où l'équation (8.17) est de la 
forme 

dy Jus. 

Fi EE 
(y, v sont des scalaires). Dans ce cas, au lieu du changement de variables (8.24), 
il est plus commode d'effectuer le changement de variables 


2 (D) = hy (th) = hy (x), u (9 — hu (th) = hv (r). (8.34) 


En effet, cffectuant ce changement de variables (de la même manière que pour 
la relation (8.25)), nous obtenons un processus discret 


z(t=zx(t—1)+(z(t — 1) + u (tb, 


qui ne contient pas le paramètre k dans le deuxième membre. Néanmoins, la 
relation (8.18) est alors remplacée (d’après la deuxième formule (8.31), 
par oi u (t) E U, où U est l’ensemble de tous les points de la forme 
h°v (vE V). 

Remarque 8.4. Dans la théorie de commande optimale des processus 
continus *) le problème fondamental est le problème à tempsnon fixé.i.e. 
le problème dans lequel le temps 7 (ci. (8.19)) n’est pas donné à l'avance. Le 
cas où l’on définit à l'avance le segment 0 < tT< 7 sur lequel on considère 
la commande cherchée s'appelle (dans la théorie des processus optimaux à temps 
continu) problème à temps fixé. Puisque dans les problèmes discrets considérés 
l'ensemble des valeurs que peut prendre + est donné à l’avance (cet ensemble 
étant le même pour toutes les commandes admissibles considérées) le problème 
analogue dans le cas du temps continu t doit donc être le problème à temps 
fixé. Ici la réduction considérée avait justement le caractère indiqué: du 
problème continu à temps fixé au problème discret de commande optimale. 


$ 3. Méthodes de résolution des problèmes 
d'optimisation discrète 


9. Programmation dynamique. Ici et dans ce qui suit nous décri- 
rons les méthodes fondamentales de recherche des régimes 
optimaux pour les objets commandés discrets. L'une d'elles est la 


*) Voir, par exemple, L. Pontriaguine, V. Boltianski, R. Gamkrélidzé, 
E. Michtchenko, Théorie mathématique des processus optimaux, Editions Mir, 
1974; V. Boltianski, Méthodes mathématiques de commande optimale, « Naouka », 
1969 (en russe). 
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méthode de programmation dynamique, due au mathématicien amé- 
ricain R. Bellman. 

L'idée maîtresse de la programmation dynamique est la sui- 
vante: pour l’optimalité du processus tout entier il faut qu'à chaque 
stade intermédiaire la partie suivante du processus possède égale- 
ment la propriété d’optimalité. Plus précisément, supposons qu’en 
effectuant la commande de l’objet discret (3.3) à (3.5), nous avons 
déjà choisi d'une certaine manière la commande w (1), 
u (2), ..., u (k) et la trajectoire x (0), x (1), ..., x (k) du début 
du processus jusqu’au moment { — X et nous voulons terminer le 
processus, ji.e. choisir uw (k + 1), ..., u (N) et x (k + 1), ... 

.., æ (N). Mais si la partie terminale du processus (du moment 
t — k au moment { — N) n’est pas optimale dans le sens du maximum 


de la fonctionnelle 
N 


Ti = >, h (x (£—1), u(t)), (9.1) 


le processus tout entier ne sera pas optimal. En effet, si nous avions 
pu améliorer la « queue » du processus, i.e. changer x (k + 1), ... 

.., æ (NW) et u (k + 1), ..., u (N) de manière que la somme des 
termes correspondants dans (3.5) augmente, nous aurions obtenu 
une amélioration globale du processus. 

Cette idée transparente est réalisée, en suivant Bellman, de la 
façon suivante. (Pour simplifier, nous nous limitons ici au pro- 
blème fondamental posé au n° 3.) Supposons qu’au moment { — k 
nous nous trouvions déjà au point x — x (k) (sans se demander com- 
ment nous y sommes parvenus à partir de l’état initial). Effectuons, 
de toutes les manières possibles, la partie terminale du processus : 


u (+1), ..s u(N; +1), ..., x (N) (9.2) 


(de manière à satisfaire aux relations (3.3), (3.4)). Pour chacune de 
ces parties terminales du processus, calculons la somme (9.1) et dé- 
signons par @z (x) — © (x (k))la plus grande decessommes. 

Ainsi, en partant du point x — x (k), nous pouvons choi- 
sir la partie terminale du processus (9.2) de sorte que la somme (9.1) 
prenne la valeur oz, (x), étant entendu qu’une valeur plus gran- 
de de cette somme ne peut être obtenue à partir du point x. En 
posant dans ce raisonnement k# — 0, 1, ..., NV, nous obtenons 
N +1 fonctions @, (x), 1 (x), ..., œnx(x). Il est clair que 
©n (x) = 0, puisque la somme (9.1) pour 4 — N ne contient aucun 
terme, i.e. elle est nulle. Il est clair d’autre part que &, (x) est 
la valeur maximale de la somme (3.5), i.e. de la fonctionnelle J, 
que nous pouvons obtenir en se déplaçant à partir du point x — x 
et en se servant de tous les processus admissibles (3.1), (3.2). Autre- 
ment dit, ©, (x,) est justement la valeur de la fonctionnelle J pour 
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le processus optimal à état initial x (0) — x,, de sorte que le 
problème de commande optimale discrète se réduit précisément à la 
recherche de la valeur &, (x,) et des moyens d'y parvenir. 

Ainsi, si nous savions calculer successivement les fonctions 
On (x), ©w1 (x), . . ., 1 (x), wo(x) en commençant par @x (x) = 
= 0 jusqu’à la fonction cherchée w, (x), cela signifierait que nous 
possédons une méthode de solution du problème discret de com- 
mande optimale. Mais une telle méthode est facile à obtenir. 

Supposons que nous nous trouvons à l'instant £ — k — { au 
point æ — x (k—1). En partant de ce point, choisissons la meilleu- 
re terminaison du processus, i.e. choisissons w (4), x (t) pour 
t = k, k+L1,..., N de manière que la somme 


N 
Jr à fi (æ(t—1), u(t) 


prenne sa valeur maximale w,_, (x). Cette somme peut s’écrire sous 
la forme 


N 
Tru fr(x (k—1), u(R)+ D fr (x(é—1), u(é)), 


le deuxième terme du second membre étant égal à J,. Il est clair 
que ce terme est égal à ox (x (k)), i.e. égal à la valeur maximale 
de la somme J, lorsqu'on se déplace du point x (k). (En effet, l’amé- 
lioration de la « queue », i.e. l’augmentation de la somme J,, nous 
amènerait, d'après ce qui a été dit plus haut, à une augmentation 
de la somme J,_,, ce qui est impossible, puisque J,_, — &z_1 (x).) 
Ainsi, 

O1 (2) = fa (x (k—1), u (E)) + ox (x (H)). (9.3) 


Remarquons maintenant que cette relation est vérifiée si x (k), 
u (k) participent à uneterminaison optimale du processus par- 
tant du point x — x (k — 1). Mais si nous choisissons x (k), u (k) 
d'une manièrequelconque (en satisfaisant aux relations (3.3), 
(3.4)), la relation (9.3) sera remplacée par l'inégalité 


on (2) >fR (x (E—1), u (k)) +ox (x (&)), (9.4) 


car le second membre de (9.4) contient une certaine somme 
Jr, non nécessairement maximale. Par conséquent, &:_1 (x) est 
la plus grande de toutes les valeurs de la somme 


fa (x (—1), u (k))+ or (x (K)), 


que l’on peut obtenir en choisissant d’une manière admissible w (k), 
x (k), i.e. 
op (x) = max [fr (x (k—1), u(k)) Ho (x (k))]. 
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Remplaçant ici dans le second membre x (k) par fx (x (k — 1), u (k)) 
(voir (3.3)) et se rappelant que x (4 — 1) — x, nous écrirons cette 
relation sous la forme définitive: 


Os (r)—= max [f(x u)+ox (fax, u))l  k=1,2,...,N. (9.5) 


u€ U, (x) 


Ici le maximum est calculé sur tous les u — u (k) (puisque x (k) 
ne fait pas partie du second membre), i.e. sur tous les points u € 
€ Un (x). 

La relation (9.5) s'appelle équation de Bellman et permet de 
calculer successivement les fonctions ox, @x_1, . .., @1, ©, en 
commençant par ox —=0 jusqu'à la fonction recherchée «, (x). 
La méthode de recherche de la fonction inconnue &, (x) à l’aide des 
relations (9.5) s’appelle programmation dynamique. 

L'application pratique de cette méthode nécessite généralement 
l’emploi d'ordinateurs à grand volume de mémoire. C’est qu'en 
calculant successivement les fonctions © (x) à l’aide des relations 
(9.5), nous ne savons pas, jusqu’au dernier moment (i.e. le moment 
où l’on obtient le nombre &, (x)), quels seront les états x (f) qui 
forment la trajectoire optimale issue du point x (0) —x,. (Cela 
sera illustré dans l’exemple 9.2 considéré ci-dessous.) Il faut donc 
chercher (et garder en mémoire) les valeurs des fonctions w, (x) 
théoriquement pour toutes les valeurs de x (mais pratiquement 
pour un treillis suffisamment dense). Ceci équivaut à trouver en 
même temps toutes les trajectoires optimales (qui correspondent aux 
différentes positions initiales x (0)). 

Pour la raison indiquée, la méthode de programmation dyna- 
mique est pratiquement peu efficace, malgré la remarquable géné- 
ralité de son domaine d'application théorique. Dans certains cas 
(d’ailleurs assez rares), l'emploi de considérations supplémentaires 
permet de résoudre le problème de façon définitive. 

En guise d'exemple, résolvons par la méthode de programma- 
tion dynamique le problème posé dans l’exemple 1.1. Pour sa solu- 
tion le lemme suivant sera nécessaire, et nous le formulons dès main- 
tenant pour ne pas interrompre l’exposé ultérieur. 


_u\À 
Lemme 9.1. La fonction u (==) définie sur le segment 
OZLu<Lc a son maximum dans le point unique u — et ce 
: : … C k+1 
maximum est égal à (=) 


La démonstration s'obtient facilement par dérivation. 
Exemple 9.2. Considérons le problème discret de commande 
optimale, posé dans l’exemple 1.1. Dans ce cas, nous n’avons que 
deux coordonnées de phase x!, x? et un seul paramètre de commande v, 
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de sorte que l’équation (3.3) s'écrit. en coordonnées sous la forme 
at (t)= fr (xt (t—1), x2(t—1), u(t)), 
a (0 = fe (at (t—1), 22 (4—1), u (E)), 
où pour f}, f; il faut prendre les fonctions (voir (1.1), (1.2)) 
fi (x!, x?, u)=x!+u, Fe (a; Lu) =4u. (9.6) 


D'autre part, le domaine U (x) = U; (x) = U: (x*, x?) est défini par 
les inégalités (voir (1.4)) 


OLu<a— x!. (9.7) 


Etudions maintenant la fonction f9 (x!, x?, u) qui définit la fonc- 
tionnelle (3.5). Puisque toute la somme (3.5) doit être (par la posi- 
tion même du problème) égale à x? (NW), i.e. doit être égale à x? (N — 
— Aju(N) (voir (1.2)): 


fa (xt (0), x2 (0), u(1))+...+fn (xt (N—1), x2(N— 
—1), u(N)=æ(N—1u(N), 


il est donc naturel de supposer que les fonctions ff sont de la forme: 
0 0 0 
fi... =fn-1=0, fn (ai, x?, u) = ru. (9.8) 


Passons à l'application de la méthode de programmation dyna- 
mique. Nous déduisons de (9.5) (d’après la relation or = 0) que 
On-1 (xt, 2?) — max fN (xt, a?, u)— max au— x? (a— xt). 

uEU(x) uEU(x) 
Ici nous nous servons du fait que x? > 0 et par conséquent le maxi- 
mum de l'expression x?u est atteint pour uw — a — x! (voir (9.7)). 
En outre, il en découle que la valeur optimale de w (NW), i.e. la va- 
leur pour laquelle J ,_ prend sa valeur maximale @,._1 (x (N — 1)), 
est égale à 


u (N) =a—zx (N — 1). 


Nous voyons donc qu’en faisant une itération (i.e. en passant de 
© y à ©&wy-1), nous n’avons aucunement déterminé la valeur de u (W); 
nous avons seulement déterminé la manière dont elle dépend de 
l’état précédent x (V — 1) (que nous ne connaissons pas non plus). 
Continuons de procéder de la même manière. Pour cela, remar- 
quons que, d’après (9.8), la relation (9.5) (pour 4 < N) se met sous 
la forme 
Op 1 (2°, x?) = Max Or (fr (x!, Le, u), fa (xt, 2, u)) — 
UEU(Xx) 
— max Op (xt +u, ru). 
uEU(x) 
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Pour 4 — N — 1, nous obtenons 


Owy-e (xt, 22)— max au (a—x!—u) = x? max u(a—x!—u). 
uEU(x) uEU(x) 
D’après le lemme 9.1, l’expression uw (a — x! — u) atteint son ma- 
st 
2 








112 
Q r a — 2 Q Q 
et ce maximum est égal à ( ) . Ainsi, 


: a 
ximum pour u — . 





= 
O2 (x°, 2) = 2? | = } 
Puisque ce maximum est atteint pour uw — (a — x!)/2, nous aurons 
pour la commande optimale w (N — 1) la valeur suivante: 


u(N—1)= 2. 


L'itération suivante donne: 


CR Dis D 2700 
Ow-s (xt, 2x2) = max d2?u (5 —) — 1? MAX U (5 —) : 
uEU(x) uEU(x) 


‘ SN , . a—xi—u 2 : 
D'après le lemme 9.1, l’expression w ——5;——) atteint son ma- 





183 
ximum pour uw —(a—x!)/3 et ce maximum est égal à ( =) 


Ainsi, 
a—zx1l1\3 
F-)- 





On-3 (t!, 2?) = x? 


D'autre part, la commande optimale w (N — 2) est de la forme 


a—zi(N—3) 
3 


En continuant ce procédé, nous obtiendrons par récurrence: 


ANR 
Onr (T1, 2?) = 2? (==) ’ 


u(N—k+1)= EU; =1,2,...,N. (99) 

Nous avons conduit jusqu'ici le processus à l’aveuglette, sans 
savoir où l’on va arriver. C’est pour cela que nous n'avons trouvé 
que la relation générale (9.9) applicable à tous les processus opti- 
maux. Servons-nous maintenant des valeurs initiales x! (0) — 0, 
x? (0) —1 (voir (1.3)). Pour 4 — N, nous obtenons de (9.9) que 
u (1) = a/N. Conformément à (1.1) cela donne x! (1) — a/N. Main- 
tenant, pour 4 — N — 1 nous obtenons de (9.9): x (2) — a/N et par 
conséquent (voir (1.1)) x! (2) — 2a/N. Ensuite, pour 4 — N — 2, 
nous tirons de (9.9) w (3) — a/N, etc. 
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Ainsi, par la méthode de programmation dynamique nous avons 
trouvé un seul processus optimal: 


u(1) =u(2)=...=u(N)=—, 


ce qui est en pleine conformité avec le résultat du problème 8.1 
(montrant ainsi que le résultat de l’exemple 8.1 est effectivement 
un résultat ex act, et non une approximation). 

L'exemple considéré permet de faire une certaine observation 
intéressante. Nous avons déjà mentionné, à la page 41, qu’un même 
problème de minimum d’une fonction peut être réduit au problème 
de la recherche des processus optimaux pour un système discret de 
diverses manières. Par exemple, le problème considére dans l’exem- 
ple 1.1 peut être décrit par l’objet discret indiqué dans les exemples 
1.1, 1.2 et peut également être réduit à un objet discret par la mé- 
thode des pages 40-41. Dans le premier cas, comme nous avons vu 
dans l'exemple 9.2, la méthode de programmation dynamique 
permet de résoudre facilement le problème. Dans le dernier cas 
(i.e. lorsqu'on réduit à l’objet discret par la méthode des pages 
40-41), nous aurons V —1 et la programmation dynamique ne 
recommande donc que la recherche d’une « fonction » (i.e. un n o m- 
bre dans le cas considéré) 

op — max f? (x, u) — max F (u). 
uEQ uen 
Mais ceci est tout bonnement l'énoncé du problème donné, et rien 
de plus. Aïnsi, avec une telle réduction à un objet discret commandé 
la méthode de programmation dynamique ne donne rien pour 
la solution du problème initial. 

Nous voyons que la « force » de la méthode de programmation 
dynamique (lorsqu'on l’applique au problème de l’extremum d’une 
fonction) dépend essentiellement de la méthode de réduction du 
problème considéré (de l’extremum d’une fonction) à tel ou tel 
problème de commande optimale d’un objet discret. 


En conclusion, considérons l’applicabilité de la méthode de programmation 
dynamique au problème de la commande optimale des objets continus. 
Prenons pour point de départ le problème « continu » de commande optimale, 
énoncé au n° 8 (voir formules (8.17) à (8.21)) en supposant que l’ensemble M, 
(voir (8.21)) coïncide avec l’espace des variables yl, ..., y" tout entier et 
réduisons-le au problème discret (8.27) à (8.30). Nous appliquerons la méthode 
de programmation dynamique au problème discret obtenu. 

L'équation de Bellman (voir (9.5)) s'écrira dans ce cas de la manière sui- 
vante : 


on ()= max [he0 (e, on (he (e, 0), k=1, 2... N, 
uE 


{voir relations (8.29) et (8.25)). Ici 


N 
on (s)=max D Ag0(x(t—1), u (6), 
t=h+1 


5—01208 
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où le maximum est calculé sur toutes les parties terminales possibles du pro- 
cessus (voir (9.2)) issues du point x (4) = x. En effectuant dans ces relations le 


changement de variables (8.23), (8.24) et en introduisant les notations Ou (y) = 
—= @;n (y) = © (x), nous obtiendrons les relations 


Ov-h (= max [Rgo (y, v) + (y+hg(y, v))], T=h, 2h, ..., Nh: \ 


. Nh l (9.10) 
OT (y)=max D, hg0(y(0—R), (6). J 
O—1t+h 


Dans la deuxième relation (9.10), la sommation se fait sur les valeurs succes- 
sives de 6 distantes l’une de l’autre de k (i.e. 6= T<+h, t + 2h, ..., Nh) 
et, par conséquent, cette relation est une expression approchée de l'égalité 


T 
O% (y) = max | g9 (y (8), v (8)) d6. (9.11) 


Ici le maximum est recherché sur toutes les commandes admissibles v (rt) e 
les solutions ho de l’équation différentielle (8.17) à condition D 


tiale y (t) = 
Quant à A première des relations (9. ne en vertu de l'égalité 


Or (+ Ag (y, v)& sur > La gi(y, v) 


(qui découle de la formule de Taylor), on peut La récrire sous la forme 


BU) —Gen + as [20 + Eu gi(u, » ]æ0. 


Cette relation est une expression ee es l'égalité 


00 (y) 


CIN L i 
. 0) "© + ue | 20 (y, FR. Oyi 8° (y; o) | =0. (9.12) 
1—1 


Les relations (9.11) et (9.12) donnent justement le principe de la program- 
mation dynamique pour le problème « continu » de commande optimale consi- 
déré. On peut l’énoncer de la manière suivante. 

Soient T un point du segment [0, T] et y un certain point de l’espace de phase 
(i. e. de l’espace des variables y}, . .., y"). Nous allons considérer toutes les com- 
mandes admissibles v (8), T<0< T (voir (8.18)) et les solutions correspondan- 
tes y (6) de l'équation différentielle (8.17) à condition initiale y (T) — y. Prenant 
le maximum pour tous les processus v (8), y (0), nous pouvons définir ©, (y) par la 
formule (9.11). 77 s'avère que la fonction ©. (y) satisfait à la relation (9.12), que 
l’on appelle équation de Bellman pour le problème « continu » considéré. 

On voit clairement, d’après ce qui a été dit, que le nombre Ô, (y) pour 
x = 0, y = y, donne la ‘plus grande valeur possible de la fonctionnelle (8.19), 
les conditions (8.17), (8.18), (8.20) étant satisfaites, et que le processus optimal 
U (T), y (T) (pour lequel la fonctionnelle (8.19) prend sa valeur maximale) satis- 
fait à l'équation de Bellman, i. e. la dre: en identité : 


BU | et, v + S Te gi (y (nv (D)=0. 


i—=1 
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Ainsi, la méthode de programmation dynamique apporte une certaine informa- 
tion sur les processus optimaux pour le problème « continu » considéré et peut 
donc être appliqué à la recherche des processus optimaux. 

Nous ne toucherons pas ici aux difficultés qui sont engendrées par l’appli- 
cation de cette méthode (dans le cas « continu »), i. e. aux difficultés liées à la 
résolution de l'équation différentielle aux dérivées partielles (9.12), compliquée 
en plus par la présence d’un maximum. Remarquons seulement ici que les raison- 
nements ci-dessus ne sont certainement pas une démonstration de la validité 
de la méthode de programmation dynamique (i.e. de la validité des relations 
(9.12) pour la fonction (9.11)). Il suffit de dire que le passage du problème 
« PUR » au problème discret et inversement, n’a pas été rigoureusement 
établi. 

Pour argumenter d’une manière correcte la méthode de programmation 
dynamique (dans le cas du problème « continu » considéré) il faut imposer cer- 
taines conditions à l'énoncé du problème. Malheureusement, ces conditions 


contiennent la fonction «©, (y) (dont le calcul signifie que le problème est réso- 
lu), de sorte que ces conditions ne peuvent être vérifiées avant la solution du 
problème. Tout ceci rend la méthode de programmation dynamique peu efficace. 
Pour plus de détails sur les difficultés liées au fondement de la méthode de pro- 
grammation dynamique (dans le cas, il est vrai, du problème « continu » à temps 
non fixé), voir la page 29 du deuxième livre mentionné dans la note au bas 
de la page 99. 

Soulignons encore une fois que la méthode de programmation dynamique, 
dans le cas des problèmes discrets, auquel est essentiellement consacré 
cet ouvrage, est tout à fait correcte. Plus loin (n° 40), nous exposerons la version 
la plus générale de la méthode de programmation dynamique, appliquée au 
problème discret de commande optimale. 


10. Principe discret du maximum. La méthode de programma- 
tion dynamique, considérée au n° précédent, est (malgré ses défauts 
qui apparaissent quand on l’applique aux problèmes « continus ») 
une des deux méthodes fondamentales employées dans la théorie 
de la commande optimale des processus continus. L’autre méthode 
est basée sur l’application du principe du maximum de L. Pontria- 
guine. Cette méthode étant la plus efficace, elle est actuellement 
admise comme la méthode fondamentale de solution des problèmes 
« continus » de commande optimale. Il n’est pas étonnant que, dès 
qu'elle fut découverte et sa démonstration trouvée, des efforts furent 
entrepris pour trouver une variante « discrète » du principe du ma- 
ximum. C’est justement cette question qui nous intéresse pour le 
moment. 

Avant tout, nous donnerons une formulation du principe du 
maximum et, prenant en considération notre but principal (le pro- 
blème discret), nous nous limiterons au cas du problème « continu » 
de commande optimale à temps fixé. À savoir, nous considérerons 
le problème (8.17) à (8.21) énoncé au n° 8 et, pour simplifier, nous 
étudierons seulement le cas de l’extrémité droite libre, i.e. nous 
supposerons que l’ensemble 7, dans la relation (8.21) coïncide avec 
l’espace des variables yl, . .., y" tout entier. Dans ce cas, le prin- 
cipe du maximum s’énonce de la manière suivante (voir p. 379 du 
deuxième livre indiqué dans la note au bas de la page 99): 


5% 
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Introduisons les variables auxiliaires @o, 1, - . ., Pr (ici n est 
le nombre de variables de phase y, . . ., y") et à l'aide ce ces derniè- 
res composons la fonction auxiliaire 


À (œ, y, v)= > qe (y, v), (10.1) 


où g° est la fonction qui figure dans la définition de la fonctionnelle 
(8.19), tandis que g', ..., g" sont les composantes de la fonction 
vectorielle g (v, y), figurant dans le second membre de l'équation (8.17). 
Ensuite, écrivons le système d'équations différentielles pour des incon- 
nues auxiliaires de la forme 


dy; oH : Ogi (y, 
ne qu j=1,...,n, (10.2) 


où nous posons 


Po Le (10.3) 


Soient maintenant v(t), 0OZT<T une certaine commande 
admissible (i.e. satisfaisant à la condition (8.18)) et y (rt) la solution 
correspondante de l'équation différentielle (8.17) à condition initiale 
(8.20). Portons les fonctions y — y (t), v —v(x) dans les seconds 
membres des équations (10.2) et désignons par œ (x) la solution de ce 
système à condition initiale 


Pa (7) = Pa (T) =... = nr (T) = 0. (10.4) 


Si le processus v (t), y (t) est optimal, i.e. maximise la fonctionnelle 
(8.19), alors, à chaque instant x (0 < t << T), nous avons la relation 
de maximum suivante : 


Æ (œ{x), y(; v (r))= max À (p (x), y (x), v), (10.5) 


ie. H (pr), y (7), v (1) > À ( (), y (T), v), quel que soit v E V. 
Si l’on se pose le problème du minimum (au lieu du maximum) 
de la fonctionnelle (8.19) l'énoncé reste le même, seule la relation (10.3) 


se récrit sous la forme 


D es (10.3) 


Le théorème énoncé (le principe du maximum) donne une con- 
dition nécessaire d’optimalité (10.5), qui permet dans de 
nombreux cas de trouver parmi tous les processus à condition initiale 
(8.20) un seul processus v (t), y (t) susceptible d’être optimal 
{ou permet de trouver un nombre fini de tels processus, parmi les- 
quels il faut ensuite choisir celui qui est effectivement optimal). 

Essayons maintenant de formuler l’analogue « discret » du prin- 
cipe du maximum. Pour cela, nous nous servirons à nouveau de la 
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méthode de passage du problème « continu » au problème discret, 
utilisée au n° 8. 

À savoir, effectuons le changement de variables (8.24) auxquelles 
nous ajouterons une nouvelle variable 1 en posant 


bp) = (th) = (Tr). (10.6) 


Alors Æ sera une fonction des variables indépendantes 4, x, u: 


A — à pi (e) g° (ce (6 —1), u (0), 


Où Yo — Po, et la relation de maximum (10.5) (que nous ne consi- 
dérons que pour les valeurs t — h, 2h, . .., Nh) dans ces nouvelles 
variables prendra la forme 


À (bp), z(—1), u()> 
> A (+ (t), z(t—1),u), quel que soit ue V;,t—1,...,N, 


1.e. 


2 be (œ(—1), u (6) > À (9 gi (1), u) 
quel que soit u€V; t—1,...,N. (10.7) 
Ensuite, la relation (10.2) peut être remplacée par l’égalité approchée 
P3(T)— qi (Th) Ç de (y (®), v (x) 
NES RES > Pi (T) NE JS FR 
i=0 

LR pa oi(y(T—h),v() 

>» Pi (T) ôyi ? 


que nous ne considérerons que pour les valeurs t — h, 2h, ..., Nh. 
En se servant des nouvelles variables, on peut récrire cette égalité 
approchée sous la forme 


hÉ—1) ep D (EEE), (40.8) 


i=0 
j=t,...,n; t=1,...,N. 


Enfin, les relations (10.3), (10.4) peuvent se récrire sous la forme 
Yo = À, (10.9) 
Yi (V) = 7e (NW) =... = (N) = 0. (10.10) 
Introduisons maintenant, comme dans le n° 8, la fonction 
f(x, u) =zx + hg (x, u) 
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et, pour uniformiser les notations, désignons la fonction hg° (x, u) 
par f° (x, u), de sorte que la fonctionnelle (8.30) s'écrit sous la forme 


J = > f(x(t—1), u(b). (10.44) 
t— 


En outre, introduisons la fonction 
H (Ÿ, T, u) — hg0 (x, u) +2 Ÿ; (x + hg* (x, u)) 2 bf° (%; u). 


Alors, remplaçant (en commettant une certaine erreur) l'égalité 
approchée (10.8) par l'égalité exacte, nous obtiendrons 


— fi (æ(t— 1), u (0) 0H GC, 21), u (0) | 
ba (6 D=2 D + 


1=12sn0s 4110 2;,:52N,: (10.12) 


D'autre part, la relation de maximum (10.7) peut se récrire sous la 
forme 


IH (p(), x (—1), u (9) 2H (p(, xt — 1), u), 
| quel que soit u € V, 
i.e. 


H (1 (6), & (1), u(6))= max A (DO, (61), u); (10.43) 
u€ 


t—1,2,...,N. 


Enfin, comme au n° 8, nous remplacerons (en commettant une cer- 
taine erreur) l'égalité approchée (8.25) par l'égalité exacte 


x (8) —=f(x(t — 1), u (b)) (10.14) 
(voir (8.29)). 


Les relations obtenues forment ensemble ce que l’on appelle le 
principe discret du maximum, mais nous le refor- 
mulerons (par analogie au principe « continu » du maximum) de la 
manière suivante. 

On considère un objet discret commandé (10.4) à domaine de com- 
mande V (voir 8.27) et à critère d'efficacité (10.11). Pour cet objet, 
on pose le problème fondamental (i.e. le problème à extrémité droite 
libre et sans restrictions imposées aux coordonnées de phase), à condition 
initiale x (0) — y, (voir (8.28)), l’optimalité étant comprise dans le 
sens du maximum de la fonctionnelle (10.11). 

Pour la solution de ce problème, introduisons des variables auxi- 
liaires1\hs, W1, . . ., Va (ici nest le nombre des variables de phase x}, ... 

.., &") et à l’aide de ces dernières définissons la fonction auxiliaire 
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suivante : 

H (Ÿ, z,u) — 2 b;f (x, u), (10.15) 
où f° est la fonction qui participe à la définition de la fonctionnelle 
(40.11) et f!, ..., f" sont les composantes de la fonction vectorielle 


f (x, u), contenue dans le second membre de l'équation (10.14). Ecri- 
vons, d'autre part, le système de relations (10.12) pour les inconnues 
auxiliaires et posons 9 —= 1 (voir (10.9)). 

Soit maintenant u (t), t — 1, 2, ..., N une certaine commande 
admissible (i.e. satisfaisant à l'inclusion u (t) € V pour tout t = 1, 
2, ..., N) et soit x (t), t — 0, 1, ..., N la trajectoire correspon- 
dante (i.e. satisfaisant à la relation (10.14)) issue du point x (0) = yo. 
Substituons les fonctions x = x (t), u — u (t) dans les seconds membres 
des relations (10.12) ; alors, en se servant des relations (10.9), (10.10), 
nous pouvons trouver successivement 4 (N — 1), (N — 2), . .., w% (1). 

Si le processus u (t), x (£) est optimal, i.e. donne le maximum de 
la fonctionnelle (10.11), alors pour tout t = 1, 2, ..., N, on à la 
relation de maximum (10.13). 

Si l’optimalité se comprend dans le sens du minimum (au lieu 
du maximum) de la fonctionnelle (10.11), l'énoncé reste le même, 
sauf que la relation (10.9) s'écrit 


by = —1. (10.9’) 


Nous avons énoncé le principe discret du maximum comme une 
condition nécessaire d’optimalité (par analogie avec le principe 
du maximum «continu »), en nous limitant d’ailleurs au cas du 
problème considéré au n° 3. Il va de soi que les raisonnements ef- 
fectués ci-dessus ne peuvent être considérés comme une démons- 
tration du principe discret du maximum, puisque le passage 
de l’objet continu à l’objet discret n’a pas été justifié et contenait 
une erreur (le remplacement des égalités approchées par des éga- 
lités exactes). 

On sait qu’il y eut des tentatives (en commençant par les tra- 
vaux de S. Katz) de démontrer le principe discret du maximum sous 
sa forme générale. Mais tous ces raisonnements sont mathématique- 
ment naïfs et contiennent des erreurs transparentes *). 

Il est donc intéressant de comprendre la signification mathé- 
matique de l’énoncé du principe discret du maximum et de vérifier 
la validité de ce principe sous cette forme. Nous verrons que 


| *) Le lecteur soviétique connaît une telle tentative entreprise dans le livre 
de Fan et Wang traduit en russe (voir la note au bas de la p.17). Ce livre, qui 
expose des problèmes d’application intéressants, est, du point de vue mathé- 
matique, non correct (comme le signale le rédacteur) ; en particulier, le raison- 
nement qui se trouve sur les pp. 33-35 de ce livre contient une erreur évidente et 
ne peut donner la démonstration du principe discret du maximum. 
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dans la formulation donnée, le principe du maximum ne sera ni une 
condition nécessaire, ni une condition suffisante d’optimalité. 

Pour comprendre la signification mathématique du principe 
discret du maximum, nous reformulerons le problème discret de 
commande optimale considéré sous forme de problème d’extremum 
d’une fonction définie sur un sous-ensemble de l’espace euclidien 
(voir n° 6). Pour cela, introduisons les variables uw}, xi (comme au 
n° 6) et désignons par €, l’espace qui a pour coordonnées toutes ces 
variables Hd, 4 ne el. vs e lt RE  — 
= 1, ..., N). Pour tout point z2€ FE, définissons les points E, (2) 
et n; (z) de la même manière qu’au n° 6. 

Puisque nous considérons le problème fondamental, les rela- 
tions (6.4) disparaissent et les relations (6.5), (6.6) seront de la forme 


mGEV,1t—=1,...,N; (10.16) 

E (z) = f (Ës-1 (z), ur (z)), L — 1, #3 N (10.17) 

(où il faut supposer &, (z} — y,). L'ensemble des points z € Æ, qui 
satisfont à toutes les relations (10.16), (10.17) sera désigné par Q. 


Alors, le problème discret de commande optimale considéré sera 
équivalent à celui de la recherche du maximum de la fonction 


F()=$f (2), m (2) + F0 (Gi (2), n2 ()) + 
: +0 (Ex: (2), Nx(z)), (10.18) 


définie sur l’ensemble Q (d’après les formules (6.8)). 
La relation (10.17) se récrit en coordonnées sous la forme 


—E(2)+ fi (Be), (2))=0:; 1=1,...,N; i=1, 
Le premier membre de cette relation sera désigné par Fi (2): 
Fi(2)= —E(2) + f (&1(2), ne (2) (10.19) 


(ici évidemment Eï (z) = x). De la formule (10.19) on obtient fa- 
cilement une expression pour les dérivées partielles de la fonction 
Fi (z) par rapport aux variables xf. Elles sont de la forme: 
OF! OF! i 
1 je rt CPRPPROPMON, ep. 7 H020) 
0x? ox _, Ori 





(les autres dérivées partielles sont nulles, puisque les autres varia- 
bles 2? ne sont pas contenues dans le second membre de l’expres- 
sion (10.19)). 

Considérons maintenant la fonction que l’on obtient de F (2) 
en ajoutant la combinaison linéaire des fonctions (10.19): 


N nn : 
G@=F(@+ D À WF, (10.21) 
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où 15 sont des constantes. Puisque toutes les fonctions FŸ (z) s’an- 
nulent identiquement sur l’ensemble & (voir (10.17), (10.19)), on a 


F (z) = G (2) sur l’ensemble Q, 


quel que soit le choix des constantes 1ÿ. Par conséquent, le problème 
du maximum de la fonction F (z) sur l’ensemble Q est équivalent au 
problème du maximum de la fonction G (z) sur l’ensemble Q. Re- 
marquons aussi que la fonction G (z) a, d’après (10.20), pour déri- 


vées partielles (par rapport aux variables xi_,): 


N nn 
0G(z) __'0F (2) OFÉ(2)  Gf0(Es-1(z), MC) vt-1, 
EL ee PE + nr men ee 
0x1  Ôx à à à CR _ “e 
ñn TE. | 
5 > pl f7 (Ës-1 1m né Ge 
j=1 
1—2,3,...,N; 
0G (2) N 
ox}, Ms 


Ainsi, si l’on pose pi = 1, on peut écrire ces dérivées partielles 
sous la forme 


(ji LS pPE:GLME) 260 EN (410.22) 


î oxi ? 
Ôt;_1 0tY 


3=0 

Supposons maintenant que uw (t), x (t) est le processus optimal 
pour le problème discret considéré, et z, est le point correspondant 
de l’ensemble Q, ï.e. &, (20) = x (t), n (2) = u(t);t—=1,..., N 
(voir 6.8)). Supposons ensuite que 1 (1), 1 (2), . .., ÿ (W) cor- 
respond à ce processus optimal en vertu du principe discret du ma- 
ximum (voir (10.10), (10.12)). Choisissons les constantes 49$ qui 
participent à la définition de la fonction G (z) (voir (10.21)) de la 
façon suivante: 


bd(shs Jet:sins sel un. 


Alors, d’après (10.22) nous obtenons 


pet) Sp PEU) 322, .,N; 


RL (M) 


ôx° N 


0G (20) 
0x! 7 
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et, par conséquent, d’après (10.10), (10.12), 


et) LUN Al in. 
0x; 


Ainsi, la fonction G (z) possède au point z — z, des dérivées par- 
tielles nulles par rapport à toutes les variables xi. 


Occupons-nous enfin de la condition du maximum (10.13). En 
l’écrivant sous la forme 


n 


À OF (1), u (9) = max À ve (OF (EE —1), 0) 


et en passant aux variables xi, ui, di, on a 


n 


D if! (Et-1 (20); Ne (20)) — 


— max >. Diff (Es (20); We), t—1,...,N. 


u,EV 1—0Ù 


n 
En ajoutant aux deux membres de cette égalité le terme — ÿ, 1pi£i (20), 
= 1 


1—= 
qui ne dépend pas de u, nous trouvons (prenant en considération 
que Ÿt — {): 


Ï0 (Ës-1 (20); M4 (20) +2 LU (= (zo) + f° (Ë:-1 (Zo); M4 (Zo))) = 


— max [f° (É1 (20), r) + > PE (—E (20) + f' (Ee-1 (20), w))]. 


u,EV 


Calculant la somme de ces relations pour £ — 1, . .., NV et tenant 
compte de (10.18), (10.19), (10.21) nous obtenons 


ZO 


où z, désigne le point qui a les mêmes coordonnées xi que le point z, 


(ie. Ei(z,) — Ei (20), quels que soient à, t) et des coordonnées uf 
quelconques sujettes aux conditions (10. 16). Autrement dit, la 
fonction G (z) atteint au point z, le maximum par rapport à toutes 
les variables uf (les variables x? étant fixées). Réciproquement, en 
raisonnant de la même manière en ordre inverse, on obtient, à partir 
de (10.23), la relation de maximum (10.13) pour tous les z = 1, 

Ve 

Ainsi, l'égalité (10.23) s’avère équivalente à la condition du 
maximum (10.13) relativement aux variables uf, xi. 
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Essayons de comprendre la signification des formules obtenues. 
Pour cela, désignons par £, l’espace de toutes les variables uf (j — 
= 4,.,..,r; s—=1,..., N) et, pour tout point u*eF, 
posons M; (u*) = (u;, ..., ui). D'autre part,,désignons par E 
l’ensemble de tous les points u* de l’espace £', dont les coordonnées 
satisfont aux conditions n; (u*) E V, 1 — 1, ..., N (cf. (10.16)). 
Ainsi, la donnée du point u* € & équivaut à celle d’une commande 
admissible w (1), ..., u (N). Remarquons maintenant que la don- 
née du point u* € # (ïi.e. la donnée des valeurs de toutes les varia- 
bles u) définit d’une manière unique les valeurs des variables x 


ce 





TE) 


Fig. 27 Fig. 28 


d’après les relations (10.17) (cela équivaut au fait que la comman- 
de uw (1), ..., u (N) définit d’une manière unique la trajectoire 
x (0), x (1), ..., æ (N) d’après les relations (10.14), puisque le 
point initial x (0) — y, est donné). 

Désignons par & (u*) le point x* — {xi} (dans l’espace Æ, de 
toutes les variables x) défini par les relations (10.17), à partir du 
point u* CE. 

Ainsi, pour tout point u* € E le point z — (u*, € (u*)) satis- 
fait à toutes les relations (10.16), (10.17), i.e. appartient à l’en- 
semble Q, tandis que, évidemment, chaque point z € Q est de cette 
forme. 

Si l’on convient de représenter sur une figure toutes les variables 
ui par un seul axe u* et toutes les variables xi par un seul axe x* 
nous obtiendrons une fonction x* — € (u*) définie sur l’ensemble # 
(situé sur l’« axe » des u*), tandis que l’ensemble de tous les points 
z = (u*, x*) pour lesquels x* — € (u*), i.e. la courbe représenta- 
tive de la fonction &, sera justement l’ensemble Q (fig. 27). 

D'autre part, une fonction G (z) est donnée dans l’espace E,, et 
l’on cherche le maximum de cette fonction sur l’ensemble Q (fig. 28) ; 
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ceci équivaut à trouver le maximum de la fonction F (z) sur l’en- 
semble Q. La fonction G (z) sera alors choisie de manière à ce que 
toutes ses dérivées par rapport aux coordonnées du point x* (i.e. 
par rapoprt à zx?) s’annulent dans un certain point z, € Q. Nous 
affirmons que sous ces conditions la validité de la condition de ma- 
ximum, i.e. de l’égalité (10.23), est une condition nécessaire pour 
que la fonction G (z) atteigne son maximum sur l’ensemble Q au 
point 2. 

C'est là la formulation du principe discret du maximum rela- 
tivement aux coordonnées uf, x. Ainsi, en faisant abstraction de 
‘la forme concrète de la fonction G (z), 
de la fonction & (u*) et de l’ensem- 
ble E, nous pouvons dire que le prin- 
cipe discret du maximum est une 
assertion du type suivant: 

Soient dans l’espace E, un certain 
ensemble E etune applicationt:2—+E£E, 
de cet ensemble & dans l’espace E.. 
L'ensemble de tous les points z — (u*, 
& (u*)), où u* EE, i.e. le graphique de 
l'application Ÿ sera désigné par 9; 
ainsi, QCE,,où EE, —=E, X ÆE, est 
le produit direct des espaces E, et F.. 

Fig. 29 Soient dans l’espace E, une certaine 

fonction G(z) et dans l’ensemble Q 

un point z0 — (uÿ, x), dans lequel toutes les dérivées partielles de 

la fonction G (z) s’annulent dans les directions contenues dans E,. 

Pour que (sous ces conditions) la fonction G (2), restreinte à l’ensem- 

ble Q, atteigne son maximum au point zo, il est nécessaire que la fonc- 

tion G (z) atteigne au point z, son maximum relativement à la va- 
riable u*, i.e. G(u*, xÿ) < G (uÿ, æxÿ), quel que soit u* EE. 

Cette assertion (dont nous discuterons la validité) sera appelée, 
puisqu'il s’agit de fonctions dans l’espace euclidien, principe eucli- 
dien du maximum. 

Des exemples simples montrent que sous la forme générale ci- 
dessus le principe euclidien du maximum est faux. La fig. 29 donne 
une illustration de ce fait: la fonction G (z) est représentée gra- 
phiquement par une surface qui a la forme d’une selle auprès 
du point z, (de sorte que toutes les dérivées de la fonction G (2) 
s’annulent au point z,); dans la direction de l’axe des u* la hauteur 
de la surface augmente (et, par conséquent, la fonction G (2) 
n’atteint pas au point z, son maximum relativement 
à la variable u*), et dans la direction de l’axe des x* la surface baïsse. 
Si maintenant la ligne Q, i.e. la courbe représentative de la fonction 
x* — Ü (u*), est assez fortement inclinée vers l’axe des u*, alors, 


en se déplaçant le long de cette ligne à partir du point z,, on fait 
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décroître la fonction G (z). Ainsi, la fonction G (2) restreinte 
à l’ensemble Q atteint au point z, son maximum, mais la condition 
nécessaire indiquée dans le principe euclidien du maximum (i.e. 
l'existence du maximum relativement à la variable u*) n’est pas 
satisfaite. 

Dans l’exemple ci-dessous cette idée est confirmée par un calcul 
précis. 

Exemple 10.1. Soient £, l’espace des variables u,, us, . .., 
..., un €t E, l’espace des variables x,, z,, . . ., x. Prenons pour 
l’ensemble Æ tout l’espace Æ, et définissons l'application £: & — 
— FE, en posant 


b (u4, Uo , ._. U x) — (U, Uo, . Un), 
i.e. le point & (u*) possède dans l’espace Æ', les mêmes coordonnées 
que le point u* dans l’espace £,. Définissons ensuite la fonction 
G (z) par la formule 


G(z) = G (wi, .…... Un; Li: .., TN) = 
=u?+...+Lukx—2(x +... +xn), (10.24) 
et pour z, prenons l’origine des coordonnées dans l’espace Æ,. Alors, 
toutes les dérivées de la fonction G (z) s’annulent au point z, y com- 
pris les dérivées par rapport aux variables x,, x, . .., æn. 
D'autre part, d’après la définition de l’application Ë l’ensem- 
ble Q est déterminé dans l’espace Æ, par les équations 


Li — WU, To — Us; . TN — UN, 
et donc, sur cet ensemble, la fonction G (z) est de la forme 
2 2 2 
— (ri + a +... +), 


i.e. cette fonction, restreinte à l’ensemble Q, atteint au point z 
son maximum. Cependant, la condition nécessaire, contenue dans 
le principe euclidien du maximum, n’est pas satisfaite puisque 
G (2), considérée comme fonction des seules variables u,, . .., ux, 
est de la forme 
u?+ ui +... +uY, 

de sorte qu’elle atteint au point z, non pas un maximum (relative- 
ment à u*), mais un minimum. Ainsi, dans le cas considéré le prin- 
cipe euclidien du maximum est faux. 

Exemple 10.2. Dans le cas général, le principe euclidien 
du maximum ne peut être non plus considéré comme une condition 
suffisante pour que la fonction G (2), restreinte à l’ensemble ©, 
atteigne son maximum au point 2. 

En effet, conservons les notations de l'exemple précédent et 
prenons pour G (z) la même fonction, mais de signe contraire 


G(z)= —-u$—...—uR +2 (x +... + xt). (10.25) 
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Toutes les dérivées de la fonction G (z) s’annulent toujours au point 
Z9, Mais maintenant la condition contenue dans le principe euclidien 
du maximum est également satisfaite, i.e. la fonction G (z), res- 
treinte aux variables u,, . .., un, atteint son maximum au point z,. 
Néanmoins, la fonction G, restreinte à l’ensemble Q, n’a pas de 
maximum au point 2. 

Ainsi, dans le cas général, le principe euclidien du maximum 
(sous la forme énoncée ci-dessus) ne représente ni une condition né- 
cessaire, ni une condition suffisante de maximum sur l’ensemble Q. 

Les exemples considérés peuvent être facilement reformulés en 
termes d'objets discrets commandés, ce qui nous permettra d’ob- 
tenir des exemples qui montrent que, dans le cas général, le prin- 
cipe discret du maximum n’est ni une condition nécessaire, ni une 
condition suffisante d’optimalité *). Pour obtenir ces exemples, 
nous poserons nr — r — À (i.e. nous supposerons qu'il n’y a qu’une 
seule coordonnée de phase et un seul paramètre de commande) et 
nous appliquerons la formule (6.8), i.e. remplacerons u,, x; par 
u (t), x (t). D'autre part, nous éliminerons entre les relations (10.24), 
(10.25) le terme x$ (puisque la variable x (N) ne figure pas dans 
la fonctionnelle (10.11)). 

Exemple 10.3. Considérons l’objet discret commandé 


BOLD, 12 sis NN (10.26) 
(ie. f(x (t — 1), u (f)) — u (#), voir (10.14)) à condition initiale 
x (0) — 0, où x (#), u (t) sont des scalaires (ie. n = r —1). 
Pour domaine de commande V (voir (8.27)) prenons le segment [—1,1]. 
Pour cet objet discret considérons le problème fondamental 
(i.e. le problème à extrémité droite libre sans restrictions sur les 
coordonnées de phase) relatif au maximum de la fonctionnelle (10.11), 
où 
f(x (Gt — 1), u (ë) = (u (1)? — 2 (x (£ — 1))°. (10.27) 
D'après le principe discret du maximum, introduisons des va- 
riables auxiliaires 4,4, %d,, où #, — 1. La fonction H (voir (10.15)) 
est ici de la forme 


H (D (£), 4 4 (£ DE 1), u (#)) “e 
= of (x (£ — 1), u ()) + ps OF (x G — D, u G)) — 
= Qu (6) — 2 (x (6 — 1)) + ps () u (), (10.28) 


et, par conséquent, les relations (10.12) s’écrivent comme suit: 


7 1) 20, 200, 20) = —hx(i—1). (10.29) 


*) Un premier exemple de ce genre fut proposé par A. Boutkovski, Sur les 
conditions nécessaires et suffisantes d'optimalité des systèmes de commande impul- 
sionnels (en russe). Automatique et télémécanique 24, n° 8, 1963. 
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cr 
CO 
(nr) 


Considérons maintenant pour cet objet discret le processus 
u(D=u()=...=uauwW=0=0, : u(WN)=t1 
(0) —=zx({)=...—x(N — 1) = 0, z(N)=1 


(il est évident que la relation (10.26) est satisfaite par ce processus). 
Pour ce processus, d’après (10.10) et (10.29), nous trouvons 


HN ==... =W2)=H4)—=0 (10.31) 
Nous obtenons de (10.26), (10.27) (pour tout processus admissible) 
J'= (@ (D) + u (2) +... + (@ (N)} — 2 (x (D) — 

— 2x (2) —...—2(G(N— 1) = (@(W)} — (u (1) — 
—(u (2 — (UN — D} <(u (NPA. 


(10.30) 


En même temps, nous avons évidemment pour le processus (10.30) 
J = 1, i.e. le processus (10.30) est optimal. Néanmoins, la condi- 
tion du maximum (10.13) pour ce processus n’est pas satisfaite 
quand # — 14, ..., IN — 1 (voir (10.28), (10.30), (10.31)): 
H (b(), xt — 1), u (t)) = 0, bd ss uN ets 
max À (b(#), x(t—1), u)= maxu—1. 
uEV uEV 
Ainsi, pour ce processus optimal, la condition nécessaire indi- 
quée dans le principe discret du maximum n’est pas vérifiée. Cet 
exemple nous montre que le principe discret du maximum est faux 
dans la formulation donnée ci-dessus. 


Exemple 10.4. Considérons le même objet discret que dans 
l'exemple précédent, mais changeons le signe de la fonctionnelle J : 


PaG—t,u()) =2(x(6— 1) — (uw ()). (10.32) 
Alors les relations (10.28), (10.29) prennent la forme 
H (p@, zG—1), u (Go) = 266 — 1) — (@ ()) + 1 (0 uv (), 


WC — 1) = 4x (t — 1). 


Par conséquent, pour le processus 


u()=...—u(N) = 0, x (0) = x (1)=...—=x(N) = 0 (10.33) 
on a la relation (10. 31). On a également, pour le ay so ee 33), 
la relation de maximum (pour toutes les valeurs £ = 1, SUN 


max A (1 (9, 2 (— 1), 2) = max (—u?) = 0 = H (h(6), & (é— 1), u(#). 


u€E V 


Néanmoins, le processus (10.33) n’est pas optimal, la fonction- 
nelle J (voir (10.32)) prenant la valeur 0, tandis que, par exemple, 
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pour le processus 
(D = tu) =:s::= UN) =0r(D=t, 
r(0)=r0)=;::3:=r(N)= 0 


on à J = 1. 

Ainsi, le principe discret du maximum n’est pas, non plus, une 
condition suffisante d’optimalité. 

Donc, contrairement au cas « continu », le principe discret du 
maximum ne donne pas, dans le cas général, ni de condition néces- 
saire, ni de condition suffisante d’optimalité. Cependant, la grande 
popularité du principe du maximum de L. Pontriaguine, qui est 
une condition nécessaire d’optimalité pour les processus commandés 
continus, très commode et largement appliquée, a dirigé les efforts 
des chercheurs vers la recherche, pour les processus discrets eux 
aussi, de conditions d’optimalité sous forme de principe du maximum. 

Premièrement, on réussit à démontrer le principe discret du 
maximum en limitant la classe des objets discrets commandés con- 
sidérés. Le premier travail dans cette direction fut celui de L. Ro- 
zonoer *), qui a démontré que dans le cas du problème fondamental 
pour les objets discrets linéaires (relativement aux coordonnées 
de phase) le principe discret du maximum est valable comme con- 
dition nécessaire et suffisante d’optimalité. 

Deuxièmement, pour les objets discrets commandés du type 
général on établit des théorèmes en précisant ou en changeant la 
formulation indiquée ci-dessus du principe discret du maximum. 
La formulation du principe du maximum pour les systèmes discrets 
possédant une certaine structure convexe est donnée dans l’article 
de A. Propoy **), mais sa démonstration contient une lacune. Des 
démonstrations correctes furent données par H. Halkin et I. Holtz- 
man et d’autres ***). Dans le travail de R. Gabassov et F. Kiril- 
lova apparaît le principe du quasi-maximum ; il établit une liaison 
entre les principes du maximum « discret » et « continu ». 

Ainsi, le principe discret du maximum, malgré sa formulation 
initiale erronée, apparaît comme une des directions fondamentales 


*) L. Rozonoer, Principe du maximum de L. Pontriaguine dans la théorie 
des systèmes optimaux, III (en russe), Automatique et télémécanique 20, n° 42, 
959 


*%#) A. Propoy, Sur le principe du maximum des systèmes de commande 
discrets (en russe), Automatique et télémécanique 26, n° 7, 1965. 

***) B. W. Jordan, E. Polak, Theory of a class of Discrete Optimal Control 
Systems, J. Electron and Control 17, 6 (1964); Pearson J., The Discrete Maximum 
Principle. Int. J. of Control 11, 2 (1965); H. Halkin, À. Maximum Principle of 
the Pontryagin Type for Systems Described by Nonlinear Difference Equations, 
J. SIAM on Control 4, 1 (1966); I. Holtzman, H. Halkin, Directional Convexity 
and the Maximum Principle for Discrete Systems, J. SIAM on Control 4, 2 (1966); 
M. Cannon, C. Cullum, E. Polak, Constrained Minimization Problem In Finite 
Dimensional Spaces, J. STAM on Control 4, 3. (1966). 


$ 3] RÉSOLUTION DES PROBLÈMES D'OPTIMISATION 81 


de recherche en théorie de commande optimale des systèmes dis- 
crets. 

11. Idées de programmation mathématique. Ici nous essayons 
de caractériser brièvement un autre groupe de résultats qui sont 
assez proches du principe discret du maximum et permettent égale- 
ment d'obtenir des resultats concernant les processus optimaux 
des objets discrets. Il s’agit des méthodes de solution du problème 
de programmation mathématique énoncé au n° 7. 

Commençons par un rappel de certaines notions classiques d’ana- 


lyse. Soit f (z) — f (z!, ..., z") une certaine fonction définie dans 
l’espace £” et régulière, i.e. possédant des dérivées continues 

ôf  ôf ôf 

“Gzi An sn (11.1) 


Ainsi, dans chaque point z, nous avons nr nombres (11.1) ; le vecteur 
ayant ces nombres pour coordonnées s'appelle gradient de la fonc- 
tion f (au point 20) ; on le désigne par grad f (2,5): 


grad f (29) — { 0f (z0) 0f (20) 0f (20) 








Soit Ô+ un vecteur quelconque issu du point z,; désignons l’ex- 
trémité de ce vecteur Par 2; alors les coordonnées du vecteur &z 
sont égales à 2! — 2, 2? — 75, ..., 2" — zj. Nous supposerons 
que le système de coordonnées zl, 2°, ..., z" dans l’espace E7 
est orthogonal. Dans ce cas, le produit scalaire des vecteurs Ô4 et 
grad f (z,) se calcule de la manière suivante : 


2 grad j (a) = 260 (oi 72) + AGO Ge) + + AG Ge ue) 


oz" 


D'après la formule de Taylor, nous avons 
Ô 0 n ! 
fe) 7 (20) + LG (2) +... + Go Gone 


où les points de suspension à la fin désignent une grandeur d'ordre 
de petitesse plus élevé que la distance entre les points z et z, (i.e. 
la longueur | 84 | du vecteur 82). Ainsi, 


Î (z) — f (20) & 84 grad f (26), (11.2) 


où &z est le vecteur qui joint les points z, et z, et l'égalité (11. 2) 
est approximative (l'erreur est une infiniment petite de degré supé- 
rieur à | |). 

Soient maintenant À une certaine courbe issue du point z, et a 
le vecteur unitaire tangent à cette courbe au point z, (fig. 30). Alors, 
pour le point z appartenant à la courbe À et différent de z, nous 
pouvons écrire | | 

Ôz = |[ôz | a, (11.3) 
6—01208 
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où Ôz est Le vecteur qui va du point z, au point z, et l'égalité est 
approximative (l'erreur ayant un plus haut degré que | 84 |). On 
déduit de (11.2) et (11.3) que pour un point z, appartenant à la 
courbe À, on a l’égalité approchée 
Î (2) — f (o) & 184 |-(a grad f (2). (11.4) 
Si le produit scalaire «a grad f (z,) est non nul, le second membre 
de la relation (11.4) possède le même signe quelle produit a grad f (z) 
(car | ôz | = 0) et, par conséquent, 
pour un | êz | suffisamment petit, le 
premier membre est également de 
même signe (fig. 31), puisque, pour un 
| Ô& | suffisamment petit, la grandeur 
qu’on ne prend pas en considération 
et qui est une infiniment petite de 
plus haut degré sera plus petite que 
le second membre de la relation (11.4). 
Fig. 30 L’assertion suivante est donc vérifiée : 
Théorème 11.1. Soit À une 
courbe issue du point z, et possédant 
au point z, un vecteur tangent a. Supposons que le produit scalaire 
a grad f (20) est non nul. Alors, pour tout point z de la courbe À diffé- 
rent de z, et suffisamment proche de z,, la différence f (z) — f (2) est 
de même signe que le produit scalaire a grad f (2). 





À A 
a 
2 
grad fl 7) a 4 
7 graû F(zy 
f2)-1a/>0 
W 
a 0 . #z7/ <0 


Fig. 31 


Supposons maintenant que la fonction f s’annule au point 2,, 
i.e. le point z, appartient à l’hypersurface f (z) — 0 (ou, autrement, 
à la frontière du domaine fermé f (z) < 0). Considérons une courbe 
quelconque À issue du point z, et située sur l’hypersurface f (z) — 0 
(fig. 32). Si a est le vecteur tangent à cette courbe au point z,, on 
doit avoir la relation & grad f (z) — 0 (car f (z) — f (z) —0 pour 
tout point z de la courbe À et, par conséquent, le produit scalaire 
a grad f (z) ne peut être non nul; voir le théorème 11.1). 

Autrement dit, le vecteur grad f (z,) est « orthogonal » (au point 
4) à chaque courbe contenue dans l’hypersurface f (z) —0, i.e. 
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« orthogonal » à l’hypersurface f (2) —0 au point z,. C’est pour 
cela que l’on appelle le vecteur grad f (z,) vecteur normal à l’hyper- 
surface f (z) — 0 au point Z. 

Etudions maintenant comment se dispose la courbe A relative- 
ment au domaine fermé f (2) < 0. Il découle directement du théorè- 
me 11.1 l’assertion suivante. 

Théorème 11.2. Soit f (z) une 
fonction régulière qui s'annule au point 
20. Soit, d'autre part, À une courbe issue 
du point z, et possédant en ce point un 
vecteur tangent a.Si a grad f (25) < 0, 
il existe un point z, € A tel que la partie 
de la courbe À qui va du point z à Z 
est entièrement contenue dans le domaine 
Î (2) < 0, et cette partie de la courbe ne 
possède aucun point commun avec 
l’hypersurface f(z) —0, autre que Fig. 32 
le point 2, (fig. 33). Mais si 
a grad f (2) >> 0, alors il existe un point z, € À tel que la partie de 
la courbe À du point z, au point z, ne possède aucun point commun 
avec le domaine f (z) < 0, autre que le point z (fig. 34). 

Appliquons ces considérations au problème de programmation 
mathématique. Supposons que la fonction Æ° (z), restreinte à l’en- 





grad #7z,) 





Hz) >0 





Fig. 33 Fig. 34 


semble Q (voir (7.1.), (7.2)), atteint son maximum au point z € Q. 
Considérons une courbe quelconque A issue du point z, et apparte- 
nant à l’ensemble Q. Alors, pour tout point z de la courbe A, ona 
l'inégalité F° (2) < F° (z) (puisque z, est le point de maximum). 
Par conséquent, pour un vecteur & tangent à la courbe A au point 
z, On à l'inégalité a grad F° (z,) L 0 (dans le cas contraire, i.e. lors- 
qu’on à l'inégalité a grad F° (z,) >> 0, on aurait, suivant le théorè- 
me 11.1, l'inégalité F° (z) — F9 (4,) > 0 pour tous les points de la 
courbe À suffisamment proches de z,, ce qui est impossible). Ainsi, 
on a le 
6* 
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Théorème 11.3. Pour qu'une fonction régulière F (2), 
restreinte à l’ensemble Q, atteigne son maximum au point z, € Q, il 
est nécessaire que pour tout vecteur a tangent au point Zy à une cer- 
laine courbe À € Q on ait l'inégalité a grad F° (z,) < 0. 

Ce théorème est néanmoins peu commode pour les applications 
puisqu'il n’est pas encore très clair comment s’y prendre pour trou- 
ver les vecteurs a jouissant des propriétés indiquées (i.e. tangents au 
point Z, à des courbes contenues dans l’ensemble Q). Essentielle- 
ment, les propriétés spécifiques de l’ensemble © (exprimées par les 
relations (7.1), (7.2)) ne sont aucunement prises en considération 
dans ce théorème. Pour préciser ce théorème, désignons par Q; l’en- 
semble de tous les points z € Æ" qui satisfont à la relation Æ° (z) — 
— 0 et par Q° l’ensemble de tous les points qui satisfont à la rela- 
tion g? (z) < 0. Alors l’ensemble Q défini par les relations (7.1), (7.2) 
peut s’écrire sous la forme 


Q=Qn...nane nn... net. (11.5) 


Soit z, un point quelconque de l’ensemble Q. Considérons le 
domaine des plus grandes valeurs (qui consiste en tous les points 
z € E* satisfaisant à l'inégalité F9 (z) > F° (z,) ) et désignons par 
Q, l’ensemble que l’on obtient en ajoutant le point z, au domaine 
des plus grandes valeurs. 

Théorème 11.4. Pour que la fonction F (2), définie sur l’en- 
semble Q (voir 11.5)), atteigne son maximum au point z il faut et il 
suffit que l'intersection 


GNneNn...nANnen...n%, (11.6) 


consiste en un seul point 2. 

Ce théorème est presque évident. En effet, si l’ensemble (11.6) 
contient un point z° =£ Z,, cela signifie que l’ensemble Q (voir (11.5)) 
contient un point Z -£ Z%, qui appartient également à l’ensemble 
Q,. Mais les relations z° € Q,, z' - z, signifient que le point z° € Q 
appartient au domaine des plus grandes valeurs, i.e. F (z') > F (2). 
Par conséquent, z, n’est pas un point de maximum de la fonction 
F" (2) définie sur l’ensemble Q. 

Exactement de la même manière (en raisonnant en sens inverse), 
nous pouvons nous assurer que si le maximum n’est pas atteint au 
point Z, l'intersection (11.6) contient un point z° Æ 2. 

Le théorème démontré réduit le problème de programmation 
mathématique au problème suivant : trouver les conditions qui impli- 
quent que l'intersection (11.6) consiste en un seul point. Nous nous inté- 
resserons, dans ce qui va suivre, aux conditions nécessaires 
pour que cette intersection consiste en un seul point. 

Remarquons que dans le voisinage du point z, l’ensemble Q 
« diffère très peu » du demi-espace À, contenant tous les points z 
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pour lesquels 
(z — 2) grad F (2) > 0. (11.7) 


Cela étant, le demi-espace X, est un cône convexe de sommet z,. De 
même, l’ensemble Qi (i — 1, ..., k) dans le voisinage du point Z 
« diffère peu » de l’hyperplan Xi défini par l’équation 


(z — 20) grad FŸ (9) —0; (11.8) 


cet hyperplan est également un cône convexe de sommet z,. Enfin 
chacun des ensembles Q° (j — 1, ..., s) dans le voisinage du point 





zo « diffère peu » d’un certain cône convexe X; de sommet z,. En 


effet, si g’ (2) — 0 (un tel indice j s'appelle actif), le cône recherché 
K; sera le demi-espace 


(z — 29) grad g° (2) < 0. (11.9) 


Mais si g” (20) << 0 (indice non actif), alors z, est un point inté- 
rieur de l’ensemble Q° et, par conséquent, on peut prendre pour 
K' tout l’espace E”. 

On peut facilement s’imaginer d’autres cas (dans le problème de 
programmation mathématique envisagé on n’en a pas besoin) où un 
certain ensemble Q* « diffère peu », dans le voisinage du point %,; 
d'un cône convexe X* de sommet z, (fig. 35), i.e. possède au point 
z, Un cône convexe À* qui lui est, pour ainsi dire, « tangent ». Un 
tel cône convexe « tangent » s’appellera par la suite coupole de l’en- 
semble Q* au point z,. 

Ainsi, nous en venons au problème suivant. Soient des ensembles 

Î, -.., Qf ayant un point commun Z, (cf. (11.6)), et des coupoles 
KŸ, ..., Kj de ces ensembles au point Z,. Il s’agit de trouver la 
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condition nécessaire à laquelle doivent satisfaire les coupoles 
1 +... Xj pour que l'intersection Q%$ AN ... NAQf ne con- 
siste qu'en un seul point z,. C’est là essentiellement l’idée usuel- 
le de linéarisation: nous remplaçons chacun des ensembles Q* par 
son « approximation linéaire » ÆXŸ (dans le voisinage du point z,) et 
nous cherchons des conditions nécessaires exprimées en termes de 
ces « approximations linéaires ». 
Pour voir sous quelle forme peut se présenter la condition néces- 
saire cherchée, considérons le cas n — 3, L — 2, i.e. le cas où nous 





Fig. 36 


avons seulement deux ensembles Q*, Q5 contenus dans l’espace (à 
trois dimensions) des coordonnées z — (z', z?, z°). Pour simplifier 
nous supposerons que les coupoles Xf, X$ de ces ensembles au point 
z, sont de dimension deux, qu'ils ne sont pas situés dans un seul 
plan et possèdent une demi-droite commune /, qui est intérieure à 
chacun des cônes K*, K$ relativement au plan qui supporte ce cône 
(fig. 36). Une telle disposition des cônes aura lieu s'ils sont insépa- 
rables et au moins un d’entre eux n’est pas un plan d'une certaine 
dimension *}). Les cônes KŸ, K3 étant « tangents » aux ensembles 

*, Q$, il semble probable que Qf et Q5 se coupent suivant une 
courbe À tangente à la demi-droite / au point z, (fig. 37). Par consé- 
quent, on peut trouver un point z° € À différent de z, et appartenant 
à la fois aux deux ensembles Q%, Q5. 


*) Si chacun des cônes KŸ, K* est un plan d’une certaine dimension, ils 
peuvent être non séparables, tout en ne possédant pas de demi-droite commune. 
Par exemple, un tel cas se présente si XF est l’axe des z!, tandis que X$ est le 
plan des variables 22, 2. 
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Ainsi, on a évidemment le théorème suivant: si les ensembles 
Qf, Q$ ont dans leur point commun z, des coupoles KŸ, K%, les cônes 
KŸ, K5 étant inséparables, et au moins l’un d’entre eux n'étant pas 
un plan, alors il existe un point z' € Q% MN Q$ différent de z,. Par con- 
séquent, pour que l'intersection Qf N Q$ contienne seulement le 
point Z, il est nécessaire que les cônes XŸ, K5 (dont au 
moins un n'est pas un plan) soient séparables. 

Il est maintenant clair dans quelle direction il faut chercher la 
condition nécessaire qui nous intéresse. Premièrement, puisque nous 
n'avons plus deux ensembles 
Q%, Q$, mais un nombre plus en: 192! 
grand (i.e. QŸf, ..., Qf), et, Se 
par conséquent, il y a plus THE 
que deux cônes K#*, ..., K*, ni 22 
il nous faut formuler une cer- d \ 
taine propriété de séparation \ 
du système de cônes convexes, fi 
qui se transforme, dans le cas AU N1} 
de deu x cônes, dans l’exis- NE oui A 
tence d’un hyperplan qui les L 
sépare. Deuxièmement, il faut 
préciser la notion de coupole d 
et démontrer le théorème sui- 
vant sur l'intersection des 
ensembles : Jrad 7 le) 

Théorème 11.5.Soient 

1, . . «, Qj des ensembles si- Fig. 37 
tués dans l’espace E” et possé- 
dant un point commun z, et soient K%, ... , KŸ les coupoles de 
ces ensembles au point 25. Si le système de cônes convexes K*, ..., K* 
ne jouit pas de la propriété de séparation et l'un au moins de ces cônes 
n'est pas un plan, alors il existe un point z' E Qf N .../fN Q; 
différent de 2. 

Il découle de ce théorème (dans le cas où au moins un des cônes 

5, . . ., Xi nest pas un plan) que l’intersection Qf N ... N Q* 
consistera en un seul point z, si le système des cônes Kf, ..., K* 
jouit de la propriété de séparation. Ainsi, si on parvient à obtenir 
dans l'expression analytique un critère selon lequel un système de 
cônes jouit de la propriété de séparation, alors nous pourrons obte- 
nir des conditions nécessaires pour le problème de programmation 
mathématique. 

Supposons d'abord que deux cônes K*, KŸ$ jouissent de la pro- 
priété de séparation, i.e. il existe un hyperplan TL de part et d’autre 
duquel sont situés les cônes KŸ et K$. Désignons par a, le vecteur 
normal à l’hyperplan T et dirigé vers le demi-espace P, qui contient 
le cône KX° (fig. 38). Le vecteur &, — —a, est alors dirigé vers l’autre 
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demi-espace P, (qui contient le cône X#). Pour tout point 2€ P, 
(en particulier pour z € K*), on a l'inégalité (z — z,) a; < 0 et pour 
tout point z € P, (en particulier pour z € K5), l'inégalité (z — z,) a, < 
< 0. Aïnsi, si les cônes KŸ et K5 de sommet commun 2, jouissent de la 
propriété de séparation, alors il existe des vecteurs non nuls a;, @ tels 
que a; + a: —0 et les inégalités (z — z,) a LO pour zE KŸ et 
(z — 20) Go L 0 pour z € K$ 

a sont vérifiées. 
e Le théorème suivant décou- 
SET | le naturellement de ces con- 
qrad F4 ) LG sidérations et généralise l’as- 
A sertion énoncée ci-dessus à un 
4 nombre de cônes supérieur 

x à deux: 





f] 

AN Théorème 11.6. Si les 
2 > cônes KŸ, ..., KŸ de sommet 
at commun z, jouissent de la pro- 


— priété de séparation, alors il 
rad 7 7, existe des vecteurs &y, . . ., @i 
dont l’un au moins n'est pas 
5 nul, tel que a; +... + ar = 
grad 7 (gl — 0 et que pour z € KŸ on ait 
l'inégalité (2 — z) 4; < 0, 
/ i —1,...,1. 

Ainsi se présente le plan de 
Fig. 38 solution du problème de pro- 
grammation mathématique. 
I1 sera entièrement réalisé (sous une forme nettement plus générale) 
dans les chapitres III et IV, où l’on définira la propriété de 
séparation d'un système de cônes convexes et l’on démontrera les 
théorèmes énoncés ci-dessus. Maintenant, nous déduirons de ces 
théorèmes la solution du problème du maximum de la fonction 

F9 (2) sur l’ensemble (11.5) posé antérieurement. 

Pour cela, rappelons-nous avant tout que la coupole de l’ensem- 
ble Q, est le demi-espace K, (voir (11.7)). Par conséquent, le vecteur 
@o, qui satisfait à la condition (z — z,) «y < 0 pour z € K,, doit être 
de la forme &;, — —1, grad F° (z,), où ÿ, > 0. D'autre part, la cou- 
pole de l’ensemble Q° sera, dans le cas d’un indice actif j, le demi- 
espace X;, défini par l'inégalité (11.9). Par conséquent, le vecteur 
adj, qui satisfait à la condition (z — z,) a; < 0 pour z € K, doit être 
de la forme 6; grad g° (45), où 0; > 0. Mais si l'indice j est non actif, 
alors Xÿ —E et on a donc aÿ —0, i.e. a; — 6; grad g° (x), où 
C; — 0. Notons que pour tout j on a l'égalité og’ (z) — 0 (puisque 


g? (z0) — 0 dans le cas d’un indice actif et o; — 0 dans le cas d’un 
indice non actif). Enfin, la coupole de l’ensemble Q; sera l’hyper- 
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plan Æ; (voir (11.8). Le vecteur ai, qui satisfait à la condition 
(z — 2) a; LO pour zE Ki, doit donc être de la forme 
—1b, grad F*(z,) (où vw; est un nombre réel quelconque). 

Supposons maintenant que la fonction FÆ° (z), définie sur l’ensem- 
ble Q (voir (11.5)), atteint son maximum au point z, € Q. L'inter- 
section (11.6) doit alors consister en un seul point z, (théorème 11.4). 
Il en découle d’après le théorème 11.5 que les cônes X,, K°, ..., K3, 
K°, ..., K; (de sommet commun z,) doivent jouir de la propriété 
de séparation. Enfin, selon le théorème 11.6 on en tire le théorème 
suivant. 

Théorème 11.7. Soit F (z) une fonction régulière, définie sur 
l’ensemble Q qui est décrit par le système de relations (7.1), (7.2). Pour 
que la fonction F9 (z), considérée sur l’ensemble Q, atteigne son maxi- 
mum au point zo € Q, il est nécessaire qu'il existe des nombres 
Dors Vis + + +» Yo Os + + + Os) dont l’un au moins est non nul, tels 
que les nombres 15, O1, . . ., ©, soient non négatifs et que l'on ait les 
relations 


k S 
21 bigrad F'(2)= Xi 0j grad g° (0), (11.10) 
i=0 j—=1 


O1! (20) = 02£? (20) — ... — O,£° (20) = 0. (11.11) 


Remarque 11.8. Dans le cas particulier où les contraintes 
(7.2) (et donc les nombres o;) n'existent pas, la relation (11.10) 
prend la forme 


k 
> Ÿ, grad F° (20) = 0. (11.12) 
i=0 


Ainsi, pour que la fonction F° (z), considérée sur l’ensemble Q qui est 
défini par les équations F1(z) —0, ..., F* (z) —0, atteigne son 
maximum (et, plus généralement, son extremum) au point z, € Q, il 
est nécessaire qu'il existe des nombres Ÿo, Vs - - ., Wr non tous nuls, 
pour lesquels on a la relation (11.12). 

C'est là le théorème classique de Lagrange de l’extremum lié. Le 
théorème 11.7 est sa généralisation. 

Exemple 11.9 En guise d'exemple, trouvons la solution 
du problème du maximum du produit, considéré dans l’exemple 1.1. 
Il s’agit de trouver le maximum de la fonction 


PV) = 5 5 2N (11.13) 
considérée sur l’ensemble Q qui est défini par les inégalités 
2 0,2 20,...,2N20, 72h28... AeN< a: (A114) 


D]! 


Ainsi, les égalités (7.1) ne participent pas à la définition de 
l’ensemble Q et il n’y a que des inégalités, qui peuvent s’écrire sous 
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la forme 
2 <0,..., —N<0,2+4+... +N _a<0, 
i.e. sous la forme (7.2), où 
Par, sa Ne, NP hs. ss EzN 
(puisque dans le cas donné s — N + {). 


Supposons que la fonction (11.13) atteint son maximum au point 
z9 € Q. Alors, d’après le théorème 11.7, il existe des nombres non 


négatifs Vo, O1, +. ., On+1, non tous nuls, tels que l’on ait les 
relations 
N+1 | 
Vo grad F° (25) — à 6; grad g” (20), (11.19) 
j=1 
C8” (z)—0, j—1,2,..., N+14. (11.16) 
Notons qu'au point Zo — (z, %,..., ZN) aucune coordonnée 
25, 35,..., ZN ne s’annule, car autrement nous aurions F° (Zo) = — 0 
{voir (11. 13)), ce qui ne donne évidemment pas demaximum 
pour la fonction F9 (2). Ainsi, 4 > 0, ..., N° 0 et, par consé- 
quent, gl (2) <0,..., 8" (2) < 0. 
Il découle maintenant de (11.16) que ©, = 02 = . — Oy =0 


et, par conséquent, la relation (11.15) se met sous la forme 
Vo grad F° (20) = Ow+1 grad gNF1 (2); V0, Owa1 20, 


1.e. 
NU ee en à 
0 Oz N+1 dzi N+1) T'es ° 
é Pi ne . s sise 
Mais la dérivée est évidemment égale à “1-0 D (ou 20): 
2 
Ainsi, 
N 
Vo-zh-28-...-20 
a gp = ON Lei, CPR LE 
Z0 
Il en résulte que © y+, -£ O0 (car tous les nombres z! » Zo en 
sont non nuls) et que tous les nombres z}, ..., zN sont égaux entre 
eux: 
N 
ee = 3p (= Von sn | 
0 — 0 ee —— 0 ET a ce e 
ON+1 


Mais vu que © y+; 5 O0, on déduit de (11.16) que 
gNF1(z)=0, ie. A++... HLzN—a—0. 
Par conséquent, 


(11.17) 
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Ainsi, le maximum de la fonction (11.13) soumise aux contraintes 
(11.14) peut être atteint seulement au point (11.17). Mais l’en- 
semble Q défini dans l’espace EN par les inégalités (11.14) est un 
ensemble fermé et borné. Par conséquent, la fonction continue (11.13), 
définie sur cet ensemble, doit nécessairement atteindre son maximum 
au moins en un point de l’ensemble Q. Par conséquent, le point 
(11.17) est effectivement un point de maximum de la fonction Æ° (2) 
et un point de maximum unique. 

Les théorèmes 11.3 et 11.7 énoncés ci-dessus permettent d'obtenir 
des conditions nécessaires d’optimalité pour les objets commandés 
discrets. En effet, comme nous avons vu au n° 6, le problème de 
commande optimale des systèmes discrets se réduit au problème de 
l’extremum d’une fonction définie sur un certain sous-ensemble de 
l’espace euclidien, et les conditions nécessaires d’extremum pour de 
telles fonctions furent justement considérées à ce numéro. 

Néanmoins, nous n'énoncerons pas maintenant toutes les condi- 
tions d’optimalité que l’on peut ainsi obtenir, nous limitant à un 
seul exemple, à savoir l’application du théorème 11.7 au problème 
fondamental, considéré au numéro précédent (p. 70). Cela étant, nous 
supposerons que le domaine de commande V est défini dans l’espace 
des variables u!, ..., u” par le système d’inégalités 


BUS sors de 0 LU sr med, 
.., g'(ut, ...,u) 0. (11.18) 


Passant aux variables wi, xi, comme au n°10, reformulons ce 


problème comme un problème de recherche d’un maximum de la 
fonction (10.18) sur l’ensemble Q défini par le système de relations 
(10.16), (10.17). Alors, d’après (11.18), les relations (10.16) s’écri- 
vent dans le cas considéré de la manière suivante: 


gi(ut, u3, ...,ut)&O0; j—1,...,1:51—1,...,N. (11.49) 


Ainsi, il s’agit du problème du maximum de la fonction (10.18) 
sur l’ensemble Q défini par le système d’égalités (10.17) et d’iné- 
galités (11.19). 

Supposons que cette fonction (définie sur l’ensemble Q) atteint 
son maximum au point Z, € Q. Alors, d’après le théorème 11.7, il 


existe des nombres Vos VE (où i —1,...,n;t —1,..., Njet des 
nombres non négatifs 0° (où j —1,..., lt —1,..., N), tels que 


N n | N l!I | 
Ÿo grad F (20) +- 2 2 Ÿ; grad F4 (0) = à à o$grad g/ (20), (11.20) 
8—1 7— s—1 = 


083 (20) 0; j=1,...,1; t—1,...,N, (11.21) 
où l’on désigne par gi (z) la fonction g? (ul, ..., u”) dans laquelle 
on a substitué à la place des arguments les valeurs u?, . .., u%, i.e. 
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g) (z) — g? (ns (z)). La relation (11.20) signifie que la fonction 
N n . N I | 
VF (+ 2 2 Vie) — 2 2 oji(c) (11.22) 
S—1 9— S—=1 1— 


possède au Dre Zo des dérivées nulles par rapport à toutes les va- 


riables, i.e. ui, ri. 
Avant tout, écrivons que les dérivées partielles par rapport aux 


variables x; s’annulent. Puisque les fonctions gi ( (z) ne dépendent pas 
de ces variables, on peut, prenant en considération (10.20), écrire le 
résultat de la dérivation de la fonction (11.22) par rapport à la va- 


riable x; sous la forme 


bo Of0 (Ës-1 (20), n4 (z0)) LS pi 03 (B-1 (0), n4 Go) _pt-1—0 


ox! “ 0x! 
Il, uns Leds, (11.23) 
et le résultat de la dérivation par rapport à zh, sous la forme 
—#ÿ—=0, i=1,...,n. (11.24) 


Occupons-nous maintenant des dérivées par rapport aux variables 
ui. Egalant à zéro la dérivée de la fonction (11.22) par rapport aux 
u; au point Z, nous obtenons (en vertu de (10.18), (10.19) et de la dé- 
finition de la fonction g? (z)): 
2 Gus ne (0) LS ge 2/5 Ei-x sa) ne () 

u? ji out 


LS one Go)) , 54, r; 121, N, 


j— æ | " 
1.e. 
_ Q l Q 
gradu (2 VF (rs (20), Me (20))) = 2 cjgrad g/(m:(20)), (11-25) 
1— 1 
A SRE | 
Fixons maintenant un certain nombre £# (—1, ..., N). Le point 


n: (Zo) appartient à l’ensemble V (voir (8.27)). Pour fixer les idées, 
supposons qu'au point 1: (z,) les À premières inégalités (11.18) sont 
actives (i.e. se transforment en égalités), et les autres ne le sont pas: 
g" (ns (20)) = 0, ..., “i (ns (20)) = 0, 
g°#1 (ne (go) 0, ..…., gl (ne (zo)) 0. 
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Autrement dit, 
gt (20) —0, ….) g? (Zo) = 0, pr (20) <0, ….s gl (20) < (0. 
Il découle de ces relations, d’après (11.21), que 


ot y=...—0t—0. (11.26) 


Soit maintenant a un vecteur issu (dans l’espace des variables 
ul, ..., u”) du point 1: (%) et tangent à une certaine courbe, située 


grad 7 ap) 





Fig. 39. 


dans l’ensemble V (fig. 39), i.e. ayant un produit scalaire non posi- 
tif avec chacun des vecteurs 


grad gl (ns: (zo)), . . …, grad g”* (ns (20)), 


que nous supposerons maintenant linéairement Ro Pre- 
nant en considération les relations (11.26) et les inégalités 0 = 0; 
nous en déduisons que le produit scalaire du vecteur & par le vecteur 
figurant dans le second membre de la relation (11.25) estnon po- 
sitif. Par conséquent, 


a grady > PÉf? (Es (20), Me (zo))) SO 


Mais cela signifie que la dérivée de la fonction 


25 Vif Era (e), me (2) (11.27) 


au point Zz, suivant la direction définie par le vecteur @ est non 
positive. 

Aïnsi, si la fonction (10.18) définie sur l’ensemble Q atteint 
point Z, son pes alors il existe des constantes 1, > 0, wi 
(Gi — 0, 1, sé = 1, , N) telles que l’on ait les relations 
(11. 23). (1. 24) : quel que soit t, la fonction (11.27) admet au point 
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Z, Une dérivée non positive suivant n'importe quelle direction qui 
entre (au point n: (z)) dans l’ensemble Y. 
Remarquons enfin que Ÿ, 0; dans le cas contraire, on obtien- 
drait successivement de (10.23), (10.24) que pY-* = 0, pN-? —0, ... 
.., Vi —0 (i —1,...,n), i.e. toutes les constantes %,, 1f se- 


raient nulles, ce qui est impossible (voir (11.20)). Ainsi ÿ, > 0. 
Puisque dans toutes les relations (11.23), (11.24), (11.27) les constan- 
tes 1; di forment des expressions homogènes (i.e. les condi- 
tions indiquées restent vraies si l’on multiplie toutes les constantes 
par un même facteur 4 => 0), nous pouvons supposer que ÿ, = 1. 

Formulons maintenant le résultat obtenu en termes de processus 
discrets commandés, i.e. remplaçons Ë; (z) par x (ft), ensuite n; (2) 
par u (t), et, enfin, 1 par 4: (é). Ainsi, il est évident que les rela- 
tions (11.23), (11.24) se transformeront en (10.12), (10.10) et la fonc- 
tion (11.27) se transformera en ÆH (pb (6), x (& — 1), u(t)). Ainsi, 
nous obtenons le théorème suivant *): 

Théorème 11.10. Soit l’objet (10.14) dont le domaine de 
commande est V (voir (8.27)). On suppose qu’en chaque point u € V 
les gradients des inégalités (11.18) actives sont linéairement indépen- 
dants. On considère le problème fondamental (à extrémité droite libre 
et sans restrictions sur les coordonnées de phase), à condition initiale 
x (0) — y, (voir (8.28)), l'optimalité signifiant le maximum de la 
fonctionnelle (10.11). 

Pour résoudre ce problème, introduisons les variables auxiliaires 
os Pro + + +» Vn (éci nest Le nombre de coordonnées de phase x', . .., x") 
et, en s’en servant, composons la fonction auxiliaire suivante : 


H (y, T, u) 2 pif (x, u), 


où f° est la fonction qui participe à la définition de la fonctionnelle 
(10.14) et fl, ..., f" sont les composantes de la fonction vectorielle 
Î (x, u) figurant dans le second membre de l'équation (10.14). D'autre 
part, écrivons le système de relations (10.12) pour les inconnues auxi- 
liaires et posons %Y) — 1 (voir (10.9)). 

Soit maintenant u (t), t —1, ..., N une certaine commande 
admissible (i.e. satisfaisant à l'inclusion u (t) € V pour tous les t — 
— 1,..., N) et soit x (t), t —0, 1, ..., N, la trajectoire corres- 
pondante (ï.e. satisfaisant à la relation (10.14)) issue du point x (0) — 
— y. Portons les fonctions x — x (t), u — u (t) dans les seconds mem- 
bres des relations (10.12); alors, en se servant des relations (10.9), 


*) En ce qui concerne les conditions d’optimalité de ce genre (consistant 
en la non-positivité de la dérivée de la fonction H (+, x, u) suivant toute direc- 
tion admissible), on peut les trouver dans les travaux de A. Propoy et 
d’autres auteurs (voir les notes sur la p. 80). 
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(10.10), nous pouvons trouver successivement 1 (N — 1), 1W(N —2), ... 


F3 Ÿ (1). 
Si le processus u (t), x (t) est optimal, i.e. donne un maximum à la 
fonctionnelle (10.11), alors pour tout t —1,..., N la fonction 


H (p (t), x(t — 1), u) possède au point u — u (t) une dérivée non po- 
sitive suivant n'importe quelle direction qui entre (au point u (t)) dans 


l'ensemble V. 
4} 
DD Ti. 
ET dé 


Het rt -Dut) | 





Ve) 
EE 

u(À CE 

Espace des & 
variables 4.4" 


Fig. 40 


Si l’optimalité est comprise dans le sens du minimum (au lieu de 
maximum) de la fonctionelle (10.11), l'énoncé reste le même, la rela- 
tion (10.9) prenant la forme 


Le théorème 11.10 est donc une condition nécessaire d’optimalité, 
démontrée correctement (en ayant, il est vrai, recours au théorè- 
me 11.7). 

Il est intéressant de comparer ce théorème au principe discret du 
maximum (p. 70). Si la dérivée de la fonction H (1 (t), x (£ — 1), u) 
au point u — u (t) suivant n'importe quelle direction qui entre dans 
l’ensemble V était non seulement non positive (comme l’affirme le 
théorème 11.10), mais encore négative, cela signifierait que 
dans un voisinage du point w (£) la fonction Æ (1 (t), x (t — 1), u) 
décroît quand on se déplace du point w (t) dans toute direction 
(sans sortir de l’ensemble V). Autrement dit, cela signifierait que 
la fonction A (1 (t), x (£ — 1), u) de la variable u € V atteignait au 
point uw ({) un maximum lo c a 1 (fig. 40). Ainsi, même si l’on rem- 
place la condition de non-positivité des dérivées, contenue dans le 
théorème 11.10, par une condition plus forte (la négativité de ces 
dérivées), nous obtiendrons la condition de maximum local de la 
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fonction Æ (1 (t), x (4 — 1), u) de la variable uw € V au point w (#), 
ce qui est considérablement plus faible que la condition de maximum 
absolu de cette fonction, contenue dans le principe discret du 
maximum. 

Nous voyons que la condition nécessaire, contenue dans le théo- 
rème 11.10, est considérablement plus faible que la condition néces- 
saire indiquée dans le principe discret du maximum. En contrepar- 
tie, le théorème 11.10 s'avère général, tandis que le principe discret 
du maximum n’est applicable qu'à une classe d’objets discrets com- 
mandés très restreinte. 

Remarquons que dans l’exemple 10.3 la condition nécessaire, 
indiquée dans le théorème 11.10, pour le processus (10.30), est, comme 
il est facile de le vérifier, satisfaite (alors que la condition nécessaire 
contenue dans le principe discret du maximum ne l’est pas). 


CHAPITRE IT 


NOTIONS FONDAMENTALES DE GÉOMÉTRIE 
MULTIDIMENSIONNELLE 


$ 4. Espace vectoriel 


12. Définition de l’espace vectoriel. L'ensemble À s’appelle 
espace vectoriel s’il est muni de deux opérations qui satisfont aux 
deux groupes d’axiomes cités ci-dessous. Les éléments de l’ensemble 
R s'appellent vecteurs; nous les noterons en caractères gras. Pour 
indiquer que le vecteur a appartient à l’espace R (ïi.e. il est son élé- 
ment), nous écrirons «a € À. 

La première des deux opérations définies sur un espace vectoriel 
s'appelle addition des vecteurs. Aux deux vecteurs a€R, bER 
cette opération fait correspondre un vecteur (du même espace), appe- 
lé somme des vecteurs a et b et noté a + b. La deuxième opération 
s'appelle multiplication d'un vecteur par un nombre. Cette opération 
fait correspondre à chaque vecteur a € R et à chaque nombre réel À 
un certain vecteur (du même espace), appelé produit du vecteur « 
par le nombre À et noté Aa. D'autre part, l'é g a lit é de deux vec- 
teurs signifiera toujours que ces vecteurs coïncident. Enfin, les axio- 
mes (dont la validité relativement à l’ensemble À et aux deux opé- 
rations du type indiqué munit cet ensemble d’une structure d’es- 
pace vectoriel) s’énoncent de la manière suivante: 

Groupel:axiomes daddition de vecteurs. 

I,. L'addition des vecteurs est commutative, i.e. on a la relation 


a +b —0d+a. 


quels que soient les vecteurs aE À, bER. 
l,. L'addilion des vecteurs est associative, i.e. on a la relation 
(a + b)+e—a+(b + 0), 


quels que soient les vecteurs a ER, bER, cER. 
1,. L'ensemble R possède un élément appelé vecteur nul (ou simple- 
ment zéro) et noté O, tel que pour tout vecteur a € R on a la relation 


a +0 = «. 
1,. Pour tout élément a ER, il existe dans R un élément, appelé 
opposé du vecteur & et noté — a, tel que a + (—a) = 0. 
7—01208 
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Groupe Il: Axiomes de multiplication 
d'un vecteur par un nombre. 
II,. La multiplication d'un vecteur par un nombre est associative, 


i.e. on a la relation 
À (ua) = (Au) a, 


quels que soient le vecteur a € R et les nombres réels À, u. 
IT,. La multiplication d'un vecteur par un nombre est distributive 
relativement à l'addition des nombres, i.e. on a la relation 


(À + u) a = Àa + ua, 


quels que soient le vecteur a € R et les nombres réels À, lu. 
IT,. La multiplication d'un vecteur par un nombre est distributive 
relativement à l'addition des vecteurs, i.e. on a la relation 


à (@ + db) = ha + Ab, 


quels que soient les vecteurs a € R, db € R et le nombre réel À. 
IT,. Pour tout vecteur a € R on a la relation 


Aa = a. 


Citons deux exemples d’espaces vectoriels. 

Exemple 12.1. Choisissons dans le plan & un certain point 
O et appelons vecteur tout point du plan $ (ce point peut éventuelle- 
ment coïncider avec O). Si À et B sont deux vecteurs quelconques 
(i.e. deux points du plan ), nous appellerons leur somme À + B le 
point C tel que le milieu du segment OC coïncide avec le milieu du 
segment AB (fig. 41). (Par conséquent, si les points O, À et B n’ap- 





Fig. 41 


partiennent pas à une même droite, OACB est un parallélogramme.) 
Soit maintenant À un vecteur quelconque et À un nombre réel. Si le 
point À ne coïncide pas avec O et que À > 0, nous appellerons pro- 


duit AA le point D de la demi-droite OA tel que _ — À; si le 


point À ne coïncide pas avec O et que À 0, nous appellerons pro- 
duit ÀA le point D situé sur la demi-droite opposée à la demi-droite 


OA et tel que ee — —À (fig. 42) ; dans les autres cas (i.e. si À coïn- 
cide avec O ou si À — 0), nous poserons AA = 0. 
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Ces définitions des vecteurs et d'opérations sur les vecteurs mu- 
nissent l’ensemble de tous les points du plan ® d’une structure d’es- 
pace vectoriel. L'élément nul de cet espace vectoriel est le point O; 





Fig. 42 


d'autre part, si À est un vecteur quelconque, le vecteur opposé — À 
sera le point symétrique au point À par rapport à O (fig. 43). 
En pratique, en considérant cet espace vectoriel on désigne d’habi- 
tude sur la figure les vecteurs non pas par des points À, B, C... 


À i] 








te 
%o 





Fig. 43 Fig. 44 


du plan &, mais par des segments orientés («rayons vecteurs ») 
— 


— — 
OA, OB, OC qui joignent le point © aux points correspondants 
(fig. 44). 

Exactement de la même manière on peut obtenir un espace vecto- 
riel en fixant un point © dans l’espace ordinaire Z de dimension 
trois (connu d’après le cours de géométrie enseigné à l’école) et en 


considérant comme vecteur tout point À ou le rayon vecteur OÀ 
de l’espace, les opérations étant définies tout comme précédemment. 

Ce « modèle géométrique » de l’espace vectoriel est la source 
principale de notre intuition géométrique, permettant d’obtenir une 
interprétation géométrique « visuelle » des faits qui se rapportent 
aux divers espaces vectoriels. 


7% 
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Exemple 12.2. Choisissons un entier naturel n et appelons 
vecteur toute suite 


rest) 


de n nombres réels. Définissons la somme des vecteurs et le produit 
d’un vecteur par un nombre en posant: 
127; —— a) + {y}, ie y"} = {x + y; ss x" + y"); 
MD ss D de res DD 

On vérifie facilement que ces vecteurs et les opérations ainsi défi- 
nies satisfont à tous les axiomes de l’espace vectoriel. On appelle cet 
espace espace vectoriel arithmétique de dimension n. 

Passons à l'étude des faits les plus simples qui découlent des 
axiomes de l’espace vectoriel. 

Théorème 12.3. Pour deux vecteurs quelconques a € R,VLdE 
€ R l'équation a + x = b a toujours une solution et une seule. 

Démonstration. Pour démontrer l'existence de la 
solution, on s'assure que le vecteur æ — (—a) + b est solution de 
cette équation. En effet, en substituant cette valeur dans le premier 
membre de l'équation, nous obtenons, en appliquant successive- 
ment les axiomes I,, I,, I, [,: 

at+x=a+((—a) + 0) = (a + (—a)) +6 = 0 + b — 

— b + 0 — b. 


L'existence de la solution est donc démontrée. 
Etablissons maintenant son unicité. Soient x, et x, deux 
solutions de l’équation donnée. On a alors 


a+ —=0, a + x, = 0, 
et, par conséquent, 
a + Li = à + Lo. 


Ici (d’après le sens même de la notion d'égalité), le premier et le 
second membre représentent un même vecteur. En ajou- 
tant ce vecteur au vecteur (—a), nous obtenons 


(—a) + (a + æ) = (—a) + (a + æ2), 
ou, d’après l’axiome I,, 
((—a) + a) + x, = ((—a) + a) + %:; 
ensuite, d’après l’axiome I,, on a 
(a + (—a)) + a = (a + (—a)) + 2%, 
et par conséquent (axiome lI,) 
0 + x, = 0 + 2%, 
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ou autrement, en vertu de l’axiome I,, 
XL —- 0 — Lo + 0 ; 


et, enfin, de l’axiome I, on déduit %, = %2. 

Le théorème 12.3 implique, en particulier, l’unicité de zéro. Sup- 
posons, en effet, que l’espace vectoriel À possède, outre l’élément 
nul 0, encore un élément 0’ jouissant des propriétés analogues (et, 
en particulier, jouissant de la propriété énoncée dans l’axiome ÎÏ,, 
(i.e. a + 0’ — à, quel que soit a E R). Alors, les deux vecteurs 0, 0° 
sont solutions de l’équation a + x — a et, par conséquent, ils coïn- 
cident d’après le théorème 12.3: 0 — 0”. 

Le théorème 12.3 entraîne également les égalités 


Oa = 0, (—1) a = —a (12.1) 


pour tout vecteur a. En effet, appliquant successivement les axio- 
mes ÎI,, ÎT,, [1,, nous obtenons 


a = Î1a = (1 +0) a = 1a + Oa = a + Ua. 


Ainsi, a + Oa — a, i.e. le vecteur x — 0a est solution de l'équation 
a + x = a. Le vecteur 0 est lui aussi solution de cette équation 
(axiome I.). En vertu de l’unicité (théorème 12.3) il en découle 
que a — 0. 

Ensuite, en appliquant successivement les axiomes IT,, II, et la 
première égalité déjà démontrée de (12.1), nous obtenons 


a+(—la=la+(—1) a = (A + (—1)) a = 0a = 0. 


Le vecteur æ — (—1) a est donc solution de l’équation a + x = 0. 
Le vecteur —a est également solution de cette équation (axiome Î,). 
En vertu de l’unicité (théorème 12.3), il en découle que (—1) «a — 
= —4. 

Nous avons énoncé ces démonstrations de façon tellement détail- 
lée pour montrer comment il faut se servir des axiomes. Par la suite, 
les raisonnements seront plus schématiques. 

L'opération de soustraction se définit dans l’espace vectoriel en 
posant 


a—b=a+(—b). (12.2) 


À l’aide de cette opération, le théorème 12.3 (compte tenu de sa 
démonstration) peut être énoncé de la manière suivante : l'équation 
a + x — b pour deux vecteurs quelconques a, b a une solution unique 
æ — b — a. Autrement dit, les relations a + c—betc—b—a 
signifient la même chose. 

Plusieurs vecteurs réunis par les signes “+ et — forment une 
somme algébrique de vecteurs. Par définition, les opérations dans une 
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somme algébrique s'effectuent successivement. Par exemple 
a—b—c+d—=t{((a — b) — c) + d; 
—a + b— c = ((—a) + b) — ec, etc. 

D'après la définition de l’opération de soustraction et d’après 
les axiomes I,, I,, on voit que le calcul d'une somme algébrique peut 
être effectué dans un ordre quelconque (en prenant en considération 
les signes écrits devant les vecteurs); par exemple, 

a—b+c—-d+e=a+c+e-b—a«a— 
= —b+e—d+a+ce, etc. 

Par aiileurs, la deuxième égalité de (12.1) et les axiomes IT,, IT, 
impliquent les règles de calcul usuelles, telles que 

a(a—b+e) =aa — ab + ac; 
(a + B — y) a =aa + Pa — ya; 
— (a —b+c) = —-a+b—c; 
(a — B) (a — D + c) = aa — Pa — ab + Bb + ac — Be 
(où &, $, y sont des nombres réels et a, b, c des vecteurs), etc. 

Notons également les règles à observer en cas d'opérations sur 
les égalités vectorielles. Nous avons déjà noté que les rélations 
a + c—=bet ce — b — a ont la même signification. Autrement dit, 
on peut faire passer un terme de la somme dans l’autre membre de 
l'égalité vectorielle en changeant de signes. Cette règle reste en vi- 


gueur dans le cas où les deux membres de l’égalité sont des sommes 
algébriques de vecteurs. Par exemple, l'égalité 


a—b+c—d4—-e 
est vérifiée si et seulement si l’on a la relation 
at+c+e—b+d. 


Ensuite, on peut multiplier les deux membres d'une égalité 
vectorielle par un nombre réel quelconque, et on peut les diviser 


par un même nombre réel non nul (la division par un nombre &« = 


se réduit à la multiplication par =) . Par exemple, pour &« 0, l’éga- 
lité 
a+b—c—-d4<+e 
est vérifiée si et seulement si l’on a 
aa + ab = ac — ad + ce. 
I1 découle de ce que l’on vient de dire, en particulier, que l’équation 


< : 1 
vectorielle «x — a possède pour « = 0 la solution unique æ — — a. 
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Autrement dit, en ce qui concerne les opérations d'addition et de 
soustraction des vecteurs et les opérations de multiplication d'un vecteur 
par un nombre, et en ce qui concerne les règles d'opérations sur les éga- 
lités, toutes les propriétés connues pour les nombres réels restent vraies 
dans les espaces vectoriels. 


13. Dimension et base. Définition 18.1. Soient @;, ... 
.... «x des vecteurs de l’espace vectoriel R et &;, . . ., à, des nom- 
bres réels. Le vecteur 

id: + ... + CAAIAA (13.1) 
s'appelle combinaison linéaire des vecteurs &@;, . .., @x à coefti- 
Cients Guy, . . ., A. 

Définition 13.2. Les vecteurs &,, ..., 4x de l’espace 
vectoriel À s'appellent linéairement dépendants s’il existe des nom- 
bres réels &,, ..., æ,, dont l’un au moins est non nul, tels que 
dt +... + aan = 0. 


Cette définition s’énonce souvent sous une autre forme. À savoir, 
la combinaison linéaire (13.1) est appelée non trivialesiau 
moins un des coefficients &,, ..., «x est non nul. La définition 13.2 
s’énonce alors comme suit: les vecteurs &;, . .., a, s'appellent li- 
néairement dépendants s’il existe une combinaison linéaire non 
triviale de ces vecteurs, égale au vecteur nul. 

Nous dirons maintenant que les vecteurs &,, . . ., &, sont liné- 
airement indépendants s’ils ne sont pas linéairement dépendants, ï.e. 
aucune combinaison linéaire non triviale de ces vecteurs ne 
s’annule. Souvent on remplace l’expression « vecteurs linéairement 
indépendants » par l’expression équivalente « s y s { à m e de vec- 
teurs linéairement indépendant ». 

On déduit de la définition précédente que pour des vecteurs 
1, -.., &n linéairement indépendants, l'égalité 


A +... + aan = 0 


implique a«, — ... — ay = 0. 
Théorème 13.3. Soient a, ..., ax des vecteurs linéaire- 
ment indépendants. Si les vecteurs V, &:, . . ., an sont linéairement dé- 


pendants, le vecteur bd peut être représenté sous la forme d’une combi- 
naison linéaire des vecteurs &j, . .., &n, t.e. il existe des nombres 
réels À, . . ., À tels que 


b=ÀAa, + ... + Àzaz. 


Démonstration. Les vecteurs D, «@,;, ..., ax étant li- 
néairement dépendants, il existe des nombres B, &;,, ..., «,, dont 
l’un au moins est non nul, tels que 


Bo + aa, + ... aan = (0. (13.2) 
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Si l’on pose B = 0, la relation (13.2) s'écrit 
id + . + aar = 0, 


et, par conséquent, l’indépendance linéaire des vecteurs @;, . .., &x 


implique œ; — ... — ax — 0, ce qui est en contradiction avec 
Je fait qu’au moins un des nombres $, &,, ..., &, est non nul. 
Donc, = 0. 
Maintenant, on obtient de (13.2) 
X AR 
bn ta 4. 
p p “* 


ou bien 


où À; sn i/B, L — ER k. 

Théorème 13. 4. Soit D,, ..., D}, € un système de vecteurs 
linéairement indépendant. Ne donnés, d'autre part, des vec- 
lEUTS Œp+y, + + +» Am (M > k + À), tels que le système de vecteurs 


D;, “2 D, Üp+is + + Am (15.3) 


est également linéairement indépendant. Alors, parmi les vecteurs 
A+, + + < Am, ON peut choisir un vecteur a, tel que si l’on remplace 
dans (13.3) le vecteur a, par le vecteur €, le système de vecteurs obtenu 
sera linéairement indépendant. 

Démonstration. Ajoutons le vecteur € au système de 
vecteurs (13.3). Si le système de vecteurs obtenu 


D, s55180 O, Œptys +. Am € (13.4) 


s'avère linéairement indépendant, alors dans le système de vecteurs 
(13.3) chacun des vecteurs @äz+1, . . ., äm peut être remplacé 
par le vecteur €, et nous obtiendrons un système de vecteurs liné- 
airement indépendant. 

Supposons maintenant que le système de vecteurs (13.4) est li- 
néairement dépendant. Alors, d’après le théorème 13.3, le vecteur € 
est une combinaison linéaire des vecteurs (13.3): 


C= Pibi +... + ide + Gun 1 + + mm: (15.5) 


Si tous les coefficients axr1, . . ., Gm étaient nuls, cette relation 
pourrait se récrire sous la forme 


C — Bab, — ... — Prdz — 0, 


ce qui est en contradiction avec l’indépendance linéaire des vecteurs 
D,, . .., 04, €. Par conséquent, au moinsun descoefficientso;+,, 
..….., Em St non nul. Supposons, pour fixer les idées, que &z+1 5 0 
(dans le cas contraire, on aurait pu changer la numération des vec- 
teurs Œp+1, + . ., Am). 
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Démontrons que le système des vecteurs 
D, ide Dz, C, pros :.. Am (13.6) 


est linéairement indépendant. Admettons que 


M01+ ... + pp + nn + Anyo@nso + + Amäm=0. (13.7) 
En substituant ici l’expression (13.5) pour €, nous obtenons 
Adi + ee nr + nu (Baba + + Prdz + Ann@r ts + 
+ Anro@p42 + + 2 + Endm) + Anro@n4o + + 4 + Amdm = 0, 
ou bien 
Qu + Anub1)04 +. Hg + nur) Or + Arnu@n ER + 
+ (ne + Anr@nte) Gr + + + + (mn + Ân1@m) Em = 0. 


Les vecteurs (13.3) étant linéairement indépendants, tous les coef- 
ficients du premier membre sont nuls; en particulier, As+ri@p+, = 0. 
Comme Ch+1 £ 0, on à Axr1 — 0. Alors, le fait que les autres coeffi- 
cients s’annulent signifie que À, — . =), = 0; +0 = fie 

— Àm — 0. Ainsi, seule la combinaison linéaire trivial e 
(13. 7) peut s’annuler, i.e. les vecteurs (13.6) sont linéairement indé- 
pendants. 

Théorème 13.5. Soient b,, ..., Um-, un système de vecteurs 
linéairement indépendant de l'espace R et &;,..., 4m un autre systè- 
me de vecteurs linéairement indépendant du même espace (contenant un 
vecteur de plus). Alors, parmi les vecteurs &;, . . ., 4m, On peut choisir 
un vecteur &, tel que le système b,, . . ., Om-1, @, sera linéairement in- 
dépendant. 

Démonstration. Pour À = 0 l’assertion du théorème pré- 
cédent prend la forme suivante: si ce 0 et le système de vecteurs 
As + +, Am St linéairement indépendant, alors on peut choisir 
parmi les vecteurs &;, . .., 4, un vecteur tel que son remplacement 
par le vecteur € nous donne de nouveau un système linéairement in- 
dépendant. Nous pouvons ainsi considérer (en changeant éventuelle- 
ment la numération des vecteurs &;, . .., 4m) que le vecteur € est 

remplacé par le vecteur «.,, i.e. le système de vecteurs €, @>, . . 

.» Am Sera linéairement indépendant. Puisque 6, = 0 (le système 


de vecteurs b,, . .., b,_. étant linéairement indépendant), nous 
pouvons appliquer cette assertion au vecteur € — b,. Ainsi, en 
changeant éventuellement l’ordre des vecteurs &a;, . . ., Am, nous 
pouvons aboutir à ce que les vecteurs 

D, Lo ._ (4 re (13.8) 


sont linéairement indépéndants. 
Appliquons maintenant le théorème 13.4 pour 4 — 1 en posant 
— b,. Nous obtenons alors que dans le système des vecteurs (13.8) 
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on peut remplacer un des vecteurs @:, . .., 4h par le vecteur b., de 
sorte que le système reste linéairement indépendant. Nous pouvons 
supposer (en changeant, le cas échéant, la numération des vecteurs 
Us, +: :» Am) Que C’est justement le vecteur &, qui est remplacé par 
le vecteur b.. Ainsi, en changeant, s’il le faut, la numération des 
vecteurs &@1, . . ., Am, NOUS pouvons obtenir le système de vecteurs 


U;, Ü, Œ>;, ._ + mn 


linéairement indépendant. 

Appliquons ensuite le théorème 13.4 pour k — 2, € — b,, etc. 
Après m — À itérations nous obtiendrons le système de vecteurs 
b,, Ds, ..., Um_1, Am linéairement indépendant (où «a, n’est pas 
nécessairement le dernier, mais un des vecteurs &,, . .., 4», donnés 
à l’origine, puisque nous avons changé la numération des vecteurs 
pendant la démonstration). 

En se servant de la notion d'indépendance et de dépendance li- 
néaire, on peut maintenant définir la dimension d’un espace vecto- 
riel. Pour cela, on introduit le groupe d’axiomes suivant : 

Groupe Il: axiomes de dimension. 

ITITI,. Dans l'espace vectoriel R, il existe n vecteurs linéairement 
indépendants. 

IIT,. Tout système de n + 1 vecteurs de l’espace vectoriel R est 
linéairement dépendant. 

Un espace vectoriel qui satisfait (pour un certain #7 > 0) aux 
axiomes de ce groupe s’appelle espace vectoriel de dimension n ou 
encore à n dimensions. Remarquons que l’espace vectoriel de dimen- 
sion nulle se compose seulement de l'élément 0. La dimension de 
l’espace vectoriel À sera désignée par le symbole dim À. I] existe 
également des espaces vectoriels qui n'ont pas de dimension finie 
(i.e. des espaces qui possèdent autant de vecteurs linéairement indé- 
pendants que l’on veut). Néanmoins, dans cet ouvrage nous nous 
limiterons à l'étude des espaces vectoriels de dimension finie. 

Définition 13.6. Un système de vecteurs ordonné de l’es- 
pace vectoriel À s'appelle base si ces vecteurs sont linéairement in- 
dépendants et leur nombre est égal à la dimension de l’espace À. 

L’axiome IIT, signifie que chaque espace vectoriel de dimension 
n possède une base. 

Théorème 13.7. Soit a;,..., a, une base de l’espace vec- 
toriel R de dimension n. Alors tout vecteur a € R peut être mis de ja- 
çon unique sous la forme d’une combinaison linéaire de vecteurs de 
cette base. Les coefficients de cette combinaison linéaire s'appellent 


coordonnées du vecteur a dans la base a, . . ., &. 
Démonstration. Soit a € À. Puisque le nombre de vec- 
teurs @, &1, .. ., @, est égal à n + 1, ces vecteurs sont linéairement 


dépendants d’après l’axiome [fI,, et, par conséquent, en vertu du 
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théorème 13.3, le vecteur «a peut être représenté comme combinaison 
linéaire des vecteurs &;, . .., @h. 
Démontrons l’unicité de cette représentation. Supposons que 


a = }@ + .-.. + And, 
A = UM + . .. + UnŒn 


sont deux représentations du vecteur 4 en forme de combinaison 
linéaire des vecteurs de la base. Alors 


Mi +... + An — Mid: Tu Undn) 
d’où 
Gi — bu) @i +... + (An — pu) an = 0. 
Puisque les vecteurs &,, ..., &, sont linéairement indépendants, 
on en déduit que 
hide sr = = = 0, Dé Messi À is 


Théorème 13.8. Tout système de vecteurs linéairement indé- 
pendant peut être complété de sorte à devenir une base. Autrement dit, 


Si b,, . . ., LU, sont des vecteurs linéairement indépendants de l’espace 
vectoriel R de dimension n, et k < n, il existe alors des vecteurs 
Dy+1, - - +, 0, tels que D,, . .., 0}, Vy+,, . . ., 0, soit une base. 


Démonstration. Puisque 4 < n, nous pouvons choisir 
k + À vecteurs linéairement indépendants dans À. D’après le théo- 
rème 13.9, on peut choisir parmi ces k + 1 vecteurs un vecteur 
b;+., tel que les vecteurs b,, . .., b;, b,+, soient linéairement indé- 
pendants. Si 4 + 1 — n, nous oblenons alors la base cherchée. Si 
£ + 1<n, on peut ajouter de la même manière, au système de 
vecteurs D,, . .., 03, b,+., linéairement indépendant encore un vec- 
teur, etc. 

Théorème 13.9. Supposons donnés dans un espace vectoriel R 
les vecteurs @;, . .., Am dont chacun se présente sous la forme d’une 
combinaison linéaire des vecteurs D,, . . ., db, de ce même espace et 
supposons que m >> k. Alors les vecteurs &a;, . . ., Am sont linéairement 
dépendants. 

Démonstration. Choisissons dans le système de vecteurs 
b,, ..., O1 un système linéairement indépendant maximal (relati- 
vement au nombre des vecteurs). Supposons, par exemple, que c’est 
le système D,, . .., bd, (où { < k). Alors pour ! << k chacun des vec- 
teurs D;11, . .., db, se présente sous la forme d’une combinaison 
linéaire des vecteurs D,,..., b, (d’après le théorème 13.3). Il en 
découle que chacun des vecteurs &,;, . .., a, se présente lui aussi 
sous la forme d’une combinaison linéaire des vecteurs b,, . .., b, 
(où l’on al! Lk < m). 

Supposons maintenant que les vecteurs &,, ..., 4m soient li- 
néairement indépendants. Alors, d’après le théorème 13.5, on peut 
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trouver un nombre s (—1, ..., m) tel que les vecteurs D,, ..., D, 
a, soient linéairement indépendants. Mais le vecteur «a, se présente 
sous forme de combinaison linéaire des vecteurs b,, . .., d,, ce 
qui contredit l’indépendance linéaire des vecteurs b,, . .., D, @.. 


Exemple 13.10. Considérons de nouveau l’espace vectoriel 
arithmétique À” (exemple 12.2) et montrons que sa dimension est 
égale à n. Pour cela, considérons les vecteurs suivants de l’espace R” : 


e, = {1, 0, 0,..., 0, 0}, 


. ee ee ee ee ee ee ee + ee 


Nous avons: 

Le + Lolo + . .. + ner = di {1, 0, DO, ..., 0, Où + 
+ 2 {0, 1, 0, ..., 0, OÙ) + ... + a, {0, 0,0,...,0,1}— 
— {a,, 0, 0, ..., 0, O} + {0, +, 0, . .., O, Où + 


sas he 00, 0, 0 sus rate os Gn sa 4h (13,9) 
On en déduit que la combinaison linéaire œje, + ... + «,e, 
s’annule si, et seulement si, l’on a à — ... — x, — 0, i.e. les 
vecteurs e1, . . ., en sont linéairement indépendants. 
La relation (13.9) nous montre que t o u t vecteur {æ;. ..., «,} 
de l’espace R”" est une combinaison linéaire des vecteurs e,, . .., e, : 
{a, . _. … On } ——= 1€] — ee. e ee + UnEn: 


D’après le théorème 13.9, il en découle que chaque système de n +1 
vecteurs dans À" est linéairement dépendant. On a donc dim À” = n, 
et les vecteurs e,, . .., e, forment une base de l’espace RAT. 

Théorème 13.11. Soient €,, €:, . .., €, une base de l’espace 
vectoriel R, a un vecteur de coordonnées x', . .., x" dans cette base et 
b un vecteur de coordonnées y}, . . ., y”, i.e. 


a = axe + ... + x'e,, 
b = y'e, + ... + y'e,. 


Alors le vecteur a + b a (dans cette même base) pour coordonnées 
xt + y, ..., x" + y" et le vecteur À@ a pour coordonnées kx!, ... 
rés AL. 

La démonstration s'obtient par un calcul évident, 

Les faits ainsi établis permettent de comparer entre eux tous les 
espaces vectoriels de dimension n. Soit p: À — S une application de 
l’espace vectoriel À dans l’espace vectoriel $S, i.e. une fonction 
définie sur l’ensemble R et ayant ses valeurs dans l’ensemble S. 
L'application s'appelle isomorphisme (ou application isomorphe) si elle 
est bijective (i.e. tout vecteur b € S est l’image d’un vecteur unique 
a € R) et de plus conserve les opérations d’addition des vecteurs et de 
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multiplication des vecteurs par un nombre, i.e. 
@ (a + 6) = @ (a) + p (6), p(Aa)=Ap(a), (13.10) 


quels que soient les vecteurs «a, b de l’espace À et le nombre réel À. 
S'il existe une application isomorphe æ: R —+S, on dit que les 
espaces vectoriels À et S sont isomorphes. Les espaces vectoriels iso- 
morphes sont essentiellement identiques; en effet, il n’y a rien 
d’autre dans un espace vectoriel que l'addition des vecteurset leur 
multiplication par un nombre; or, ces opérations sont conservées 
par les applications isomorphes. 

Théorème 13.12. Deux espaces vectoriels de dimension finie 
R et S sont isomorphes si, et seulement si, dim R = dimS. 

Démonstration. Remarquons tout d’abord que l’iso- 
morphisme ®: RÀ —+S applique le vecteur nul sur le vecteur nul: 

(0) — 0. En effet, si a € R, alors a + 0 — «a et donc, d’après 
(13.10), o (a) + p (0) = p (a) d’où l’on obtient que p (0) = 0. En- 
suite, une combinaison linéaire de vecteurs est appliquée dans une 
combinaison linéaire aux mêmes coefficients, i.e. b = &;@; +... 
... + a 4x implique p (b) = «,;p(a;) +... + a,p (ax) (d’après 
(13.10)). Par conséquent, l'égalité &,a; +... + a;ax = 0 est sa- 
tisfaite si, et seulement si, &,®p (a;,) + ... + ax (ax) = 0. Mais 
alors il est clair que les vecteurs &,, . .., a, de l’espace R sont li- 
néairement indépendants si, et seulement si, les vecteurs 
 (a;), ® (@2), . .., p (&:) de l’espace S sont linéairement indépen- 
dants. Par conséquent, le nombre m a x i m a l de vecteurs linéaire- 
ment indépendants des espaces À et S est le même, i.e. dim R — 
— dim $. Ainsi, si des espaces vectoriels sont isomorphes, ils ont 
la même dimension. 

Inversement, supposons que les espaces vectoriels À et S ont la 
même dimension nr. Choisissons dans l’espace À une base a,, . .., &äh 
et dans l’espace S une base D,, . .., d,. Alors, chaque vecteur € € R 
se met de façon unique sous la forme € = Ma; +... + Aa, (où 
M, ..., N° sont les coordonnées du vecteur c dans la base a,,... 

., &n). Désignons maintenant par  (c) le vecteur (de l’espace S) 
qui possède dans la base b,, . .., db, les mêmes coordonnées, i.e. 
œ(c)=Mb, +... +1", Nous obtenons une application 
œ: R —$S. On vérifie facilement que l'application construite est 
un isomorphisme. 

Il découle du théorème démontré que fout espace vectoriel de di- 
mension n est isomorphe à l’espace R" (voir l’exemple 13.10). Choisis- 
sons dans l’espace vectoriel À de dimension n# une base a;, ..., &h 
et dans l’espace R" prenons la basee.,,..., e, considérée dans l’exem- 
ple 13.10. Alors, l'application isomorphe ®, construite dans la 
démonstration du théorème 13.12, fait correspondre au vecteur 
€ = Ma; +. + de l’espace RÀ Le vecteur @ (€) = ke, +.. 

. + de, = A à , À"} de l’espace R" (voir (13.9)). Ainsi, 
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en fixant dans l’espace vectoriel R de dimension n une base a;,,...,a, 
et en faisant correspondre à chaque vecteur € = Ma, +... + l'a, € 
€ R le vecteur (ce) = {M, .:., A} ER", nous obtenons un iso- 


morphisme œ@: R —.RT. 
On identifie souvent les espaces À” et R en vertu de cet 


isomorphisme, i.e. on écrit simplement Aa, + ... + l'a, — 
= {Àl,..., AT au lieu de (Ma, + ... + \'a,) = {}, 
, À"}. Ainsi, l'écriture € — £\, . .., A} signifie que le vecteur 


c € R possède les coordonnées À!, ..., N° (dans la base a,, ... 

., An). Il va de soi que cette écriture n’est admissible que si l’es- 
pace À est déjà muni d’une base &,, ..., @, (qui reste fixe dans les 
raisonnements en question). 

14. Sous-espace. Dans cette section À sera toujours un espace 
vectoriel de dimension n. 

Définition 14.1. L'ensemble À € R s'appelle sous-espace 
de l’espace À si pour tout vecteur «a € À et tout nombre réel À le 
vecteur Àa appartient à l’ensemble À et, d'autre part, la somme 
a + b de deux vecteurs quelconques «a, b € À appartient également 
à l’ensemble À. Il découle immédiatement de cette définition que 
si les vecteurs &,, . . ., &, appartiennent au sous-espace À, alors toute 
combinaison linéaire Aa, + ...—+ Àfa, de ces vecteurs appartient 
également au sous-espace À. En particulier, l'élément nul appartient 
à tout sous-espace. Il est clair que l’ensemble contenant seulement 
l'élément 0 est un sous-espace ; ce sous-espace (nous le noterons par 0) 
est dit trivial. Tout autre sous-espace est non trivial. Il est clair égale- 
ment que l’ensemble À qui coïncide avec tout l’espace À est un sous- 
espace ; ce sous-espace est dit impropre. Tout autre sous-espace (donc 
différent de À) est dit propre. 

Exemple 14.2. Considérons dans l’espace usuel Z de di- 
mension 3 le plan $ et dans le plan ®$ choisissons un certain point O. 
Alors Z et ® peuvent être considérés comme espaces vectoriels à 
condition de définir les vecteurs et les opérations sur les vecteurs 
comme dans l'exemple 12.1. On vérifie facilement que & est un 
sous-espace propre non trivial de l’espace vectoriel ZX. 

Exemple 14.3. Considérons l’espace arithmétique À” de 
dimension nr; choisissons un nombre naturel m << n et désignons 
par À, l’ensemble des vecteurs de la forme {A4, . .., Am, D, . .. 

. 01, i.e. des vecteurs dont les dernières 7 — m coordonnées sont 
nulles (les premières nr coordonnées peuvent être aussi bien diffé- 
rentes de O0 que nulles). On vérifie facilement que À, est un sous- 
espace propre non trivial de l’espace R7. 

Théorème 14.4. Tout sous-espace À de l’espace vectoriel R 
est lui-même un espace vectoriel (relativement aux opérations sur les 
vecteurs donnés dans l’espace R), et l’on a dim À < dim À. L'égalité 
dim À — dim À est satisfaite si, et seulement si, 4 sous-espace À est 
impropre. 
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Démonstration. Pour deux vecteurs quelconques &, db € 
E A la somme «a + b appartient (d’après la définition 14.1) au 
m ê m e ensemble À. Les axiomes I,, I, sont satisfaits dans À pour 
tous les vecteurs et, en particulier, pour les vecteurs de l’ensemble 
A. D'autre part, puisque 0 € À, l’axiome I, est également satisfait 
dans À. Enfin, puisque —a — (—1) a, pour tout vecteur «a € À, 
le vecteur —a« appartient également à À, et par conséquent l’axiome 
I, est satisfait dans À. Ainsi, tous les axiomes du groupe I sont satis- 
faits dans À. On vérifie tout aussi facilement les axiomes du grou- 
pe II. Ainsi, À est un espace vectoriel. 

Par ailleurs, si les vecteurs &@;, . .., 4» du sous-espace À sont 
linéairement indépendants dans À, ils le sont dans tout l’espace R, 
car les opérations dans À sont les mêmes que dans tout l’espace À. 
Mais il n’existe pas dans À de système de vecteurs linéairement indé- 
pendants en nombre supérieur à n. Par conséquent, il n’existe pas 
dans À plus de n vecteurs linéairement indépendants. Ainsi, 
dim À < n, i.e. dim À < dim À. 

Si À est un sous-espace impropre, i.e. À = À, alors on a évi- 
demment dim À — dim À. Inversement, si dim À — dim À, on 
a dim À = n. Alors, on peut choisir dans À n vecteurs linéairement 
indépendants e,, ..., e,. Ces vecteurs forment une base dans À, 
i.e. tout vecteur x € R se met sous la formex = Me, + ... + Ne. 
Mais alors x € À, puisque la combinaison linéaire de vecteurs de À 
appartient également au sous-espace À. Ainsi, tout vecteur x € R 
appartient au sous-espace À, i.e. À — À et, par conséquent, À est 
un sous-espace impropre. 

Théorème 14.5. L'intersection de deux (ou plus, générale- 
ment, d’un nombre quelconque) sous-espaces est un sous-espace. 

Démonstration. Soient À et B des sous-espaces de l’es- 
pace vectoriel À. Soient ensuite a, & deux vecteurs appartenant à 
l'ensemble C — À f B. Puisque «a € C, le vecteur & appartient à 
chacun des sous-espaces À, B. Exactement de la même manière, le 
vecteur b appartient à chacun des sous-espaces À, B. Puisque 
a, bEA,et puisque À est un sous-espace, on a a + bE À. Dela même 
manière, &æ + b € B. Ainsi, le vecteur « + b appartient à chacun des 
sous-espaces À, B, i.e. a + b EC. Nous voyons que si a, bEC, 
alors le vecteur & + b appartient également à l’ensemble C. 

On démontre d’une manière analogue que &a € C implique Àa € C 
(quel que soit le nombre réel À). Ainsi C est un sous-espace. Les rai- 
sonnements restent les mêmes dans le cas de l’intersection d’un 
nombre quelconque de sous-espaces. 

Il découle du théorème 14.5 que pour tout ensemble 0€ R on 
peut trouver un sous-espace m i n i m a l contenant l’ensemble ©Q, 
i.e. un sous-espace contenu dans chaque sous-espace qui contient ©. 
En effet, considérons t o u s les sous-espaces qui contiennent l’en- 
semble Q (de tels sous-espaces existent: par exemple, À lui-même), 
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et notons par ZA l'intersection de tous ces sous-espaces. D’après le 
théorème 14.5, LQ est un sous-espace. IL est clair que Q € La et que 
LA est contenu dans tout sous-espace contenant l’ensemble Q. Ainsi, 
LA est le sous-espace minimal recherché, contenant Q. On l’appelle 
sous-espace engendré par l’ensemble ©. 

Théorème 14.6. Soit Q & R. Le vecteur x € R appartient au 
sous-espace Lo, engendré par l’ensemble ©, si, et seulement si, æ se met 
sous la forme d'une combinaison linéaire de vecteurs appartenant 
à l’ensemble ©. 

Démonstration. Désignons par À l’ensemble de tous les 
vecteurs æ € R qui se mettent sous la forme d’une combinaison 
linéaire de vecteurs appartenant à l’ensemble Q. IL est aisé de voir 
que si a, b € À, alors a +b € À, et si a € À, alors Àa € À, quel que 
soit le nombre réel À. Ainsi, À est un sous-espace de l’espace vecto- 
riel À. 

Puisque on a évidemment 0€ À (La étant un sous-espace m i - 
n i m a | qui contient Q), l'inclusion À 3 Z, est vérifiée. 

Inversement, si æ € À, i.e. æ = Àqu + ... + Àq,, où q: € Q, 
i — 1, ...,s, alors (d’après l'inclusion Qc Z4), nous aurons 
di Eloi =1,...,s,et, par conséquent (L, étant un sous-espace), 
le vecteur &æ = Mg; +... + lg, appartient à Lo. Donc, AG Lo. 

Des inclusions démontrées A = L,, A LQ il découle que 
A = Lo. 

On déduit du théorème 14.6 que pour tout entier positif r satis- 
faisant aux inégalités 0 Lr L n, on peut trouver dans R un sous- 
espace de dimension r. Pour r = 0 et r — n, cela est évident. Suppo- 
sons que 0 <r< n. Choisissons dans À un système de r vecteurs 
linéairement indépendants e,, . .., e, (par exemple, les premiers r 
vecteurs d’une base) et désignons par Q l’ensemble de tous ces vec- 
teurs. Puisque le sous-espace Z, engendré par l’ensemble Q contient r 
vecteurs linéairement indépendants e;, ..., e,, on a dim Lo 2>r. 
D'autre part, chaque vecteur æ € La (d’après le théorème 14.6) se 
met sous la forme d’une combinaison linéaire des vecteurs e,, ... 

., e- et, par conséquent, d’après le théorème 13.9, tous les r + 1 
vecteurs du sous-espace Z, sont linéairement dépendants. Par con- 
séquent dim Lo <r. Il découle des inégalités démontrées que 
dim Lo =r. 

Exemple 14.7. Montrons que deux sous-espaces quelconques 
de dimension r sont « disposés de la même manière » dans À. Autre- 
ment dit, si À et B sont deux sous-espaces de dimension r de l’es- 
pace vectoriel À, alors il existe un isomorphisme p: À —R de l’es- 
pace À sur soi-même, tel qu’il envoie le sous-espace À par un iso- 
morphisme sur le sous-espace B. 

En effet, soit &,,..., @- une base du sous-espace À. Les vecteurs 
di, ..., à, sont alors linéairement indépendants et, donc, d’après 
le théorème 13.8, ce système de vecteurs peut être complété jusqu’à 


$ :] ESPACE VECTORIEL 113 


la base a, . .., Gr, @r+1, . . ., @, de tout l’espace R. Soit mainte- 
nant 0,, ..., b, une base du sous-espace B. On peut alors d’une 
manière analogue compléter le système de vecteurs 6,, . .., b, pour 
obtenir une base b,, ..., b,,0,+1, . . ., d, de l’espace À. 

Notons maintenant par ® l’isomorphisme de l’espace À sur soi- 
même qui envoie le vecteur de coordonnées À, ..., À” relative- 
ment à la base a,, . .., a, sur le vecteur qui a les mêmes coordon- 
nées relativement à la base D,,..., D, (cf. la fin de la démonstra- 
tion du théorème 13.12): 


o (Ma + ... + N'a,) = MB +... + AB. 


Alors le vecteur x appartenant au sous-espace À, i.e. le vecteur de 
la forme 


x = Mat... +Nar+Oaru+...+0a;, (14.1) 
a pour image par l'application q le vecteur 
Mit... .+Nb, +O0b;u+...+0b,, (14.2) 


i.e. un vecteur appartenant au sous-espace B. Ceci étant, chaque 
vecteur appartenant au sous-espace B, i.e. de la forme (14.2), est 
l’image du vecteur (14.1), appartenant au sous-espace À. Aïnsi, l’iso- 
morphisme œ restreint au sous-espace À est un isomorphisme de À 
sur le sous-espace B, donc œ est l’isomorphisme cherché. 

Contrairement à l'intersection (voir le théorème 14.5), la ré u - 
nion Al} B de deux sous-espaces À et B n’est pas en général 
un sous-espace. On peut, néanmoins, considérer le sous-espace e n - 
g endré par la réunion À |} B. Ce sous-espace s’appelle somme 
des sous-espaces À et B; il est noté À + B. 

Théorème 14.8. Soient À et B deux sous-espaces de l’espace 
vectoriel R. Le vecteur x € R appartient au sous-espace À + B si, et 
seulement si, il se met sous la forme x = a + b,où a € À, b € B. 

Démonstration. Comme AC A + B, BE À + B, le 
vecteur a + b appartient au sous-espace À + B, quels que soient 
&æ£CA,bdE B. 

Inversement, soit æ € À + B. Alors, d’après le théorème 14.6, 
on à &Æ — Àlg +... + Àfg.,, où chacun des vecteurs g4, . .., ds 
appartient à l’ensemble À |] B, i.e. appartient à l’un des sous-espa- 
ces À, B. Supposons, par exemple, que g1, . .., Qn € À, Qntys + . 

.., 4€ B. Alors, on a évidemment % = a + b où 


a=Mqi+...+NqReA, b—=N*tquut... +25q€ B. 


Théorème 14.9. Soient À et B deux sous-espaces de l’espace 
vectoriel R. Soient ensuite L = À + B leur somme et C= AN B 
leur intersection. Alors 


dim Z — dim À + dim B — dim C. (14.3) 
8—01208 
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Démonstration. Notons par r la dimension du sous-espa- 
ce C et soit e,, . .., e; une base de ce sous-espace. Désignons par p 
et q les dimensions respectives des sous-espaces À et B. Puisque les 
vecteurs e,, ..., e- sont situés dans le sous-espace À et sont linéai- 
rement indépendants, on peut les compléter par les vecteurs f,4,, . .. 
..., f?p jusqu'à une base e,, . .., e,, fr+1, . . ., fn Au sous-espace À 
(d’après le théorème 13.8). De la même manière les vecteurs e,, . .. 
..., € peuvent être complétés par les vecteurs g,41, . . ., ga jus- 
qu’à une base e;, ..., €,, ÿr+1, . . ., 4 Au sous-espace B. 

Nous montrerons que les vecteurs 


Cr, ce. Cr, Îrui: ..., 1-5: Yrits ce. Ja (14.4) 


forment une base du sous-espace L. Puisque le nombre de ces vecteurs 
est égal à p + (g — r) — dim À + dim B — dim C, la formule (14.3) 
en découle immédiatement. 

Soit æ un vecteur quelconque appartenant au sous-espace L. 
D'après le théorème 14.8, æ — a + b, où a € À, b € B. Le vecteur 
a € À se met sous la forme d’une combinaison linéaire des vecteurs 
Eys + + +) Crs ris + + + fp et, par conséquent, sous la forme d’une 
combinaison linéaire des vecteurs (14.4) (à coefficients nuls pour les 
vecteurs Yr+1, + « + Ya). De la même manière le vecteur b € B se 
présente sous la forme d'une combinaison linéaire des vecteurs (14.4). 
Par conséquent, le vecteur x = a + b se met lui aussi sous la forme 
d’une combinaison linéaire des vecteurs (14.4). 

Il nous reste à démontrer que les vecteurs (14.4) sont linéaire- 
ment indépendants. Supposons que 


Les + ... + rer + rtf 41 + + pl p+ 
| + Vrnra + ee 4 Voga = 0, (14.5) 
1. €. 
ie: + .... + Urer + rx f r41 + ver + App — 
= — Vpp4@ ri — + — VaYge (14.6) 


Le vecteur du premier membre de l'égalité (14.6) appartient au 
sous-espace À, et celui du second membre au sous-espace B. Mais 
comme il s’agit du même vecteur, il appartient au sous-espace À f 
N B = C. Le vecteur (14.6) se met donc sous la forme d’une combi- 
naison linéaire des vecteurs e,, ..., e,: 


— VrnYru— ce — VaYa = (AT + ss. + Grer, 


ou bien 
es +... + rer + VrnQru + à 22 4 Va a = 0. 


De l'indépendance linéaire des vecteurs e1, . .., €;, Qrtys + + +» Jo 
(qui forment une base de l’espace B) il découle que tous les coeffi- 
cients de cette égalité sont nuls. En particulier, 


Vu=:ss=v= 0; 
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On en déduit d’après (14.6) que 
Dies +... + Urer + Ar fre + re + Apf p = 0, 


et donc 
Hi = = é 6 = Ay=Ù 


(puisque les vecteurs e,, . .., e,, frys, - - ., f?, formant une base 
du sous-espace À, sont linéairement indépendants). Ainsi, tous les 
coefficients dans la relation (14.5) sont nuls, i.e. les vecteurs (14.4) 
sont linéairement indépendants. Le théorème est démontré. 

Soient À et B deux sous-espaces de l’espace vectoriel R de di- 
mension n. Si À + B—R et À f\ B — 0, on dit que B est le sup- 
plémentaire direct du sous-espace À et l’on écrit R — À @ B (dans 
ce cas À est également le complémentaire direct du sous-espace B, 
i.e. À — B @ À, puisque dans la définition énoncée les rôles des 
sous-espaces À et B sont identiques). Ainsi, si R — À @ BP, alors 
dim (4 + B) = n, dim (4 f\ B) = 0 et, par conséquent, en vertu 
de (14.8), dim À + dim B — n. Inversement, si À N B = 0 et 
dim À + dim B = n, alors dim (4 + B) = n, i.e. R = À 6 B. 
Ainsi, nous avons obtenu la proposition suivante: 

Théorème 14.10. Soient À et B deux sous-espaces de l’es- 
pace vectoriel R de dimension n, dont l'intersection est le sous-espace 
trivial. Pour que À et B soient les supplémentaires directs l’un de 
l’autre (i.e. R = À © B}, il faut et il suffit qu’on ait l'égalité 


dim À + dim B = n. 


Remarquons encore que si R = À @ B'etsie;, ..., e, est une 
base de À et 7, ..., f, une base du sous-espace B, alors les vec- 
teurs 


(ZE #82 Cp) 11; sos La 


forment une base de tout l’espace R (voir 14.4)). 

Théorème 14.11. Soient À et B deux sous-espaces de l’espace 
vectoriel R de dimension n. La relation R — À @ B est vérifiée si, et 
seulement si, chaque vecteur % € R se met de façon unique sous la 
forme x = a +d; a € À, bE B. 

Démonstration. Supposons que À — À @ B. Puisque 
dans ce cas À + B = R, il découle du théorème 14.8 que chaque 
vecteur x € R se met sous la forme x—a<+b,a€A,bE B. Si, en 
outre, on avait une représentation analogue æ = a” + db’, a’ € À, 
b'EB, on aurait 


a+b=a +0, 
d'où a — 4 — D’ — b. 

Le vecteur a — a” appartient au sous-espace À, et puisqu'il est 
égal au vecteur b” — D, il appartient également au sous-espace B. 
Par conséquent, «a — a’ € À fj B et donc a — a’ —0, b° — b — 0, 

8* 
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i.e. a—=a", b —b". Ainsi, l’unicité de la représentation x = «@ + b, 
a CA, bEB est démontrée. 

Inversement, supposons que chaque vecteur x € À soit repré- 
sentable de façon unique sous la forme x — a + b, a € À, b € B. 
Alors, d'après le théorème 14.8, chaque vecteur x € R appartient au 
sous-espace À + B, i.e. À + B — R. S'il existait un vecteur non 
nul CE AN PB, nous aurions deux représentations distinctes 


c=c+0, cEA,0€B, 
c—0+c, 0EA,cEB, 


ce qui contredit l'hypothèse du théorème. Par conséquent, À NN] B — 
= 0 et, donc, R — À @ B. 

En conclusion, considérons la notion de somme directe. Soient 
A1, + .., A, des sous-espaces de l’espace vectoriel À de dimension 
n. On dit que l’espace R se décompose en somme directe des sous-espaces 
A1, ..., Ag et l’on écrit 


R= A, CP ® Ah) (14.7) 
si chaque vecteur æ € R se met de façon unique sous la forme 
= +...+ar, AE Ay, cs Ar E À. 


Remarquons que dans la définition ci-dessus, nous n’excluons 
pas le cas où certains des sous-espaces dans la relation (14.7) sont 
triviaux (i.e. consistent en un seul élément 0). 

Le théorème 14.11 nous montre que la décomposition de l’espace 
R en somme directe de deux sous-espaces À, B a lieu si, et seulement 
si, À et B sont des supplémentaires directs l’un de l’autre, i.e. la 
relation À — À @ B a la même signification que précédemment. 

Théorème 14.12. Soit R — À @ B, et supposons que le 
sous-espace À (considéré comme espace vectoriel) se décompose en somme 
directe de ses sous-espaces À,, ..., Az: 


A=A,@ ... DA. (14.8) 


A lors, l’espace R se décompose en somme directe des sous-espaces À,, ... 

ces A, B : 
RAS" xs Ar GB: (14.9) 
Démonstration. Soit x € R. Alors, en vertu de la rela- 
tion À — À @ B, on peut écrire x = a + b, où a € À, b € B. 
Ensuite, le vecteur «a € À peut, d’après (14.8), se mettre sous la 

forme 

a =... + an ME Au ..., ar € À. (14.10) 


Par conséquent, 
= +... +ar+b; EE A, ..., ax € Ar, bd € B. (14.11) 
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Il nous reste à démontrer que la décomposition (14.11) est unique. 
Supposons qu'outre (14.11) on a la décomposition 


x=a+...+art+0'; a E A1, .... axE Ar, Db'EB. (14.12) 
Comme A,;S A,i—1,...,k,ona a; +... + ax€ A, et, par 


conséquent, la décomposition æ = (a; + ... + ax) + b' doit 
coïncider avec la décomposition æ — «a + b, ï.e. 
a—=4+...+a, b — D. (14.13) 


Mais, d'après (14.8), la première des décompositions (14.13) doit 
coïncider avec la décomposition (14.10), i.e. 


di dy, -.., An — Ar. 


Ainsi, les décompositions (14.12) et (14.11) coïncident, 

Théorème 14.13. Si R — À + B, il existe un sous-espace 
DC B tel que R = À @ D. 

Démonstration. Posons C — À f} B et choisissons dans 
l’espace vectoriel B un sous-espace D qui est un supplémentaire 
direct du sous-espace CC B, de sorte que B — C @ D. Puisque 
DEB,onaD=Bf\ Det 

ANDSAN(BND)=(ANBND-CND, 
i.e. À N] D est un sous-espace trivial. Par conséquent, d’après le 


théorème 14.10, il suffit de démontrer que dim À + dim D — nr. 
Nous avons, d’après la formule (14.13), 


n — dim À — dim À + dim B — dim C — dim À + 
+ (dim € + dim D) — dim C — dim À + dim D, 


ce qui termine la démonstration. 

Remarquons aussi que si R=4,@ ...@ À x et si ei: ; 
..., e% est une base du sous-espace À,, ensuite, ef”, .. .,ef 
est une base du sous-espace 4,, ..., et enfin ef), ..., e() est une 

k 


base du sous-espace À,, alors les vecteurs 

(1) (1) (2) (2) 

Of y res Crpn Of 3 ces Epns cour OÙ, cs en 
forment une base de l’espace R. Ceci se démontre facilement par 
récurrence en se servant de la relation 


À, ® À: .. ® An = A1 @ (4: @ + ® À»). 


15. Homomorphismes d’espaces vectoriels. Définition 15.1. 
L'application o: À — S de l’espace vectoriel À dans l’espace vecto- 
riel S s’appelle komomorphisme si elle respecte les opérations d’addi- 
tion des vecteurs et de multiplication des vecteurs par le nombre, 
i.e. satisfait aux conditions (13.10). 

Contrairement aux isomorphismes, les homomorphismes peuvent 
ne pas être injectifs et surjectifs. 
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Soient p: À —+$S un homomorphisme et À un sous-espace de 
l'espace À. Nous noterons p (4) l’image du sous-espace À par l’ap- 
plication ®, i.e. l’ensemble de tous les vecteurs de la forme œ (x), 
où æ € À. En particulier, on peut considérer l’image  (R) de tout 
l’espace À par l’homomorphisme o ; on l’appelle image de l'homomor- 
phisme ® et on écrit Im ® (i.e. Im p = p (A)). 

Théorème 15.1. L'image o (A) d'un sous-espace quelconque 
AC R par l’'homomorphisme @®: R —S est un sous-espace de l’es- 
pace vectoriel S. 

Démonstration. Soient «a, b € p (4), i.e. il existe des 
éléments x, y € À, tels que @ (x) — a, p (y) — 6. Alors 


a+b6=çp(x) + (y) = (x + y). 
Puisque æ + y € À (A étant un sous-espace), on a a + b € p (À). 
Ainsi, si a, b € @ (A), alors a + b € p (4). 
Supposons maintenant que & € p (A), i.e. a = (x), où x € À, 
et soit À un nombre réel. Alors 


a = Àp (x) = p (ÀX). 


Puisque Àx € À (A étant un sous-espace), on a Àa € p (4). Ainsi, si 
a € (4), alors Àa € p (A) pour tout nombre réel À. Ainsi, œp (4) 
est un sous-espace. 

Supposons à nouveau que p: À —+$S est un homomorphisme et 
B un sous-espace de l’espace S. On appelle image réciproque du sous- 
espace B par l’homomorphisme ® l’ensemble de tous les éléments 
x € R pour lesquels p (x) € B. Cette image réciproque sera notée 
p-1(B). En particulier, on peut considérer l’image réciproque 
p-! (0) du sous-espace trivial; on l'appelle noyau de l’homomor- 
phisme ® et on le note Ker . Ainsi, le noyau Ker ® consiste en tous 
les éléments x € À, pour lesquels o (x) = 0. 

Théorème 15.2. L'image réciproque ®"! (B) d’un sous-espace 
quelconque BE $S par l’homomorphisme @: R —S est un sous-espace 
de l’espace vectoriel R. 

Démonstration. Soient a, bE p!(B), i.e. (a) € B, 
p (6) € B. Puisque B est un sous-espace, il s'ensuit que œ (a) + 
+ p (6) € B, i.e. p (a + b) € B. Par conséquent, a + bep”! (B). 
Ainsi, si @, b Ep ! (B), alors @a + b € p”! (B). 

Supposons maintenant que @ € 1 (B), i.e. p (a) € B, et soit À 
un nombre réel. Puisque B est un sous-espace, on en déduit que 
ko (a) € B, i.e. p (Aa) € B. Par conséquent, Aa € p-* (B). Aïnsi, si 
a € p!(B), alors Àa € p ! (B) pour tout À réel. 

Théorème 15.3. Pour tout homomorphisme ®: R —Sona 
la relation 


dim À — dim (Im œ) + dim (Ker ®). (15.1) 


Démonstration. Notons la dimension du sous-espace 
[Im œ@ par p et soit €C,,..., € une base de ce sous-espace. Puisque 
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Cys +. Cp € Im ®, il existe des éléments e;, ...,e, € R tels que 


P (es) = Cu. P (ep) = Cp. 
Les vecteurs e;, . .., e, sont linéairement indépendants, car l’éga- 
lité œe, + ... + anen = 0 implique que ap, (es) + ... 

. + ap (ep) = 0, i.e. &C, + ... + &pCp —= 0, et par consé- 
quent &œ = ... = An = LV. 

Désignons par Z le sous-espace de l’espace À engendré par les 
vecteurs e1, ..., €. D’après le théorème 14.6, le sous-espace Z 
consiste en tous les vecteurs de la forme zxle, + ... + x°e,. Il dé- 
coule immédiatement de la relation 


p(ztes+...+ale,)=xte;+...+afe, 


que l’application @ considérée sur Z est un isomorphisme de l’espace 
L sur le sous-espace [Im . 

Soit æ € R. Alors, @ (x) € Im @ et puisque op (Z) = Im op, on 
peut trouver un élément a € Z tel que ® (a) = œ (x). Ainsi, @ (x) — 
— p (a) = 0, i.e. p (x — a) = 0, et l’élément b — x — a appar- 
tient donc au sous-espace Ker . Aïnsi, 


x =a+b; a€tL, bE Kery, (15.2) 


i.e. tout vecteur x € R se met sous la forme (15.2). 
Démontrons l’unicité de cette représentation. Supposons que 
l’on ait, outre (15.2), la représentation 


æ = a" +d'; a EL, b'E Ker y. (15.3) 


Alors, a + b — a” +b’, d'où a — a’ — b'—bE Ker y, et, par consé- 
quent, (a — a’) = 0. Ainsi donc, p (a) = p (a'). Mais puisque 
a,a’ € Letl'application ®p,considérée sur Z, est un isomorphisme, on 
en déduit que a = a’. Maintenant, la relation @ + b — a’ + b° 
entraîne b — b'. Par conséquent, les représentations (15.2) et (15.3) 
coincident, ce qui démontre l’unicité. 

En vertu du théorème 14.11, nous trouvons maintenant que À — 
== Z, © Ker ® et, par conséquent, 


dim À = dim Z + dim (Ker ) 


{théorème 14.10). Mais comme les sous-espaces ZL et Im @ sont iso- 
morphes, on a, d’après le théorème 13.12, dim Z — dim (Im op). 
Théorème 15.4. Soient R et S des espaces vectoriels et e,, . .. 
., € une base. de l’espace R. Alors pour des éléments @;, . .., &h 
quelconques de l'espace S , il existe un homomorphisme unique ®: R —- 
— S, satisfaisant aux conditions 


P (e1) = a, . .., (er) = An. (15.4) 


Démonstration. Soient x un élément quelconque de l’es- 
pace R et x!, ..., x" ses coordonnées par rapport à la base e,, . .. 
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er: 
x = axe + ... + z'e,. (15.5) 
Posons 
p (œ) = za; + ... + za. (15.6) 


Ainsi, pour tout æ € R, nous avons défini l'élément œ (x) € S. On 
vérifie directement que l’application p: R —S ainsi obtenue satis- 
fait aux conditions (13.10), i.e. elle est un homomorphisme. Il est 
également clair que cet homomorphisme satisfait aux conditions 
(15.4). Ainsi, l’existence de l’homomorphisme cherché est démontrée. 

Etablissons l’unicité. Soit p,: À —$S un homomorphisme qui 
jouit des propriétés données, i.e. 


Pi (Ex) = Aus +, Pi (en) = An. 
Alors, pour le vecteur (15.5), nous avons 
1 (x) = pre +... +ie,) = xtp(es) +... +zo(e,) — 
= lait... +" an = q(x). 


Ainsi p, (æ) = œ (x) pour tout élément x € R, i.e. l'homomorphis- 
me ®, coïncide avec l’homomorphisme œ défini ci-dessus. 

Remarque 15.5. Soit f,, ..., f, une base de l’espace S. 
Ecrivons chacun des vecteurs @;, . .., a, (voir (15.4)) sous la forme 
d’une combinaison linéaire des vecteurs de la base: 


aj=cifit...+cËfr, j=1,...,n. (15.7) 


Alors la relation (15.6) s'écrira 


n : n  k 
p (X) = 2 ra; — 2 2 ccifs. 
= 


92= 1—= 


Autrement dit, 


p(x)=yt fat... +yfr, (15.8) 
où 
Jordan (15.9) 
ÿ=1 


Ainsi, l’homomorphisme @: R —S, qui satisfait aux conditions 
(15.4), peut être décrit de la manière suivante: il envoie le vecteur 
x de coordonnées xl, ..., x" par rapport à la base e,, ..., e, 
(voir (15.5)) dans le vecteur ayant pour coordonnées y!, ..., y* par 
rapport à la base fi, . .., f, (voir (15.8)), ces coordonnées étant 
définies par les formules (15.9) ; les nombres c; sont alors définis par 
les égalités (15.7). 
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Remarquons maintenant que la définition des nombres c; (i — 
= 1, ...,k; j—1,...,n), i.e. la définition de la matrice 
C = (c;) est équivalente à la définition des vecteurs @z, . . .. &n 
(voir (15.7)). Par conséquent, on a l’assertion suivante: 

Soient R un espace vectoriel de base e;, . .., e, et S un espace vec- 
toriel de base f,, . .., f,. Tout homomorphisme pm: R —$S se définit 
uniquement par les formules (15.5), (15.8), (19.9) si l’on connaît la 
(x X n)-matrice C — (ci), i.e. l’homomorphisme @ envoie l'élément 
x € R de coordonnées x!, . .., x" dans l'élément de coordonnées y', ... 
..., y* définis par les formules (15.9). Ainsi, nous avons établi une 
bijection entre les homomorphismes R —$S et les (k X n)-matrices 
C = (ci). 

Définition 15.6. Soit R — À @ B. D'après le théorè- 
me 44.11, chaque vecteur x € R se met de façon unique sous la forme 


x—=a+b; alt A, bE B. 


Le vecteur a s'appelle projection du vecteur æ sur le sous-espace À 
parallèlement au sous-espace B. 

Théorème 15.7. Soit R = A @ B. Pour chaque vecteur 
2 € R notons x (x) la projection du vecteur æ sur le sous-espace À paral- 
lèlement au sous-espace B. L'application x ainsi obtenue de l'espace R 
dans soi-même (appelée projection sur le sous-espace À paral- 
lèlement au sous-espace B) est un homomorphisme. On a en plus Im x — 
— À, Kerx = B. 

Démonstration. Soit x, y € R.Mettonsles vecteurs x, y 
sous la forme 


x = Qi + Di, Y — As + be; Qu, QG: E À, b,, D: € B. 
Alors a, = n (x), a; = n (y). Nous avons 

x + y = (a + b,) + (as + 62) = (as + a) + (61 + D). 
Puisque «a; + a: € À, db, + D, € B, on en déduit que 


dt+a=n(x +y),i.e. x (x + y) = nr (x) + x (y). 


D'une manière analogue on établit la relation x (Âx) = Àn (x). 
Ainsi, x est un homomorphisme. 

Il est évident que Im x « 4. Mais pour un vecteur quelconque 
a € À, nous avons x (a) = a (puisquea = a +0; a€£A, 0€ B} 
et pour cette raison Im x = 4. Ainsi, Im x = À. 

Enfin, l'inclusion x € Ker x, i.e. x (x) — 0 a lieu si, et seule- 
ment si, % — 0 + b, où bEB, i.e. si æEB. Autrement dit, 
Ker x — B. 

Définissons maintenant quelques opérations sur les homomor- 
phismes. 
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Soient œ, et ®, deux homomorphismes de l’espace vectoriel R 
dans l’espace vectoriel S. Pour chaque x € R, les éléments ®, (x) et 
æ, (x) sont des vecteurs de l’espace S et nous pouvons considérer 
leur somme p, (x) + mp, (x). Définissons l'application 9: À —-$S par 
la formule | 


b (x) = m1 (x) + pa (x), x ER. 


On vérifie directement que l’application % est un homomor- 
phisme de l’espace vectoriel À dans l’espace vectoriel S. On 
appelle cet homomorphisme somme des homomorphismes p, et 2: 


Ÿ = Pr + Po 


Ainsi, on a par définition (p, + p.) (x) = 1 (x) + 2 (x), quel 
que soit x € À. 

Soient maintenant : À —S un homomorphisme et À un nombre 
réel. Définissons l’application x: À —S par la formule 


x (x) = Àp (x), x € À. 


On vérifie directement que l'application % est un homomor- 
phisme de l’espace À dans S. Cet homomorphisme s'appelle 
produit de l’homomorphisme œ par le nombre À: 


X = À. 


Ainsi,ona par définition (Ap) (x) = À (p (x)), quel que soit x € À. 

Supposons enfin que p: À —+$S est un homomorphisme de l’es- 
pace À dans l’espace S, et: S$ —> T un homomorphisme de l’espace 
S dans l’espace 7. Définissons l’application &: À — T par la for- 
mule 


C(x) —=vb(p(x))}, xEe À. 


On vérifie directement que l'application & est un homomor- 
phisme de l’espace À dans T. Cet homomorphisme s'appelle 
composée des homomorphismes 4 et @ et se note 4 © 

= po. 
Ainsi, on a par définition (d ° @) (x) = 14 (p (x)), quel que soit 
x € LR. 

Théorème 15.8. Soient R et S des espaces vectoriels. L'en- 
semble de tous lesihomomorphismes R —S, avec les opérations d'addi- 
tion et de multiplication par les nombres réels définis ci-dessus, est un 
espace vectoriel de dimension dim R-dim S. Cet espace sera noté 
Hom (AR, S). 

Démonstration. Soient p,, p: € Hom (AR, S), i.e. p et 
æ, sont des homomorphismes À —$S. Démontrons que mp, + @2 — 
— p, + p,. Nous avons (pour x € R quelconque): 


{pa + pe) (X) = Pa (X) + Pa (x), (pe + Ps) (x) = pe (x) + p1 (x): 
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Puisque ®p, (x) + mp: (x) = p2 (x) + op, (x) (car dans l’espace vecto- 
riel S l’addition est commutative), on a' 


(1 + Pa) (x) = (Pa + qu) (©), quel que soit x € À. 


Cela veut justement dire que les homomorphismes @, + ®, et 
+ , Coïncident, i.e. p, + p: = ps + p,. On a ainsi démontré 
que l’axiome I, est satisfait dans l’ensemble Hom (AR, S). On vérifie 
d’une manière analogue les autres axiomes des groupes I et II; no- 
tons seulement que l’élément nul de Hom (2, S) est l’homomorphis- 
me qui envoie tout l’espace À dans l'élément nul 0 € S, et que l’élé- 
ment —® (pour p € Hom (À, S))se définit par l'égalité (—œ}) (x) — 
— — p(x)), quel que soit æ ER (ie. —p—(—1)p). Ainsi, 
Hom (R, S) est un espace vectoriel. 

Désignons par n la dimension de l’espace À, par k celle de l’es- 
pace $ et démontrons que l’espace vectoriel Hom (R, S) est is o - 
morphe à l’espace vectoriel de toutes les (4 X n)-matrices C — 
— (c;) aux éléments réels. Pour cela, fixons dans À une base e,, ... 

.., €n €t dans l’espace S une base f,, ..., f.. Chaque homomor- 
phisme] ®: À —+S permet de définir dans l’espace S les vecteurs 
di = ®P (es), ..., An: —=  (e,) ; ensuite, en mettant ces vecteurs sous 
la forme d’une combinaison linéaire des vecteurs de la base f,, . .. 
..., fr (voir (15.7)), nous définissons les nombres c;, i.e. faisons 
correspondre à l’homomorphisme œ une certaine (4 X n)-matrice 
C = ci). D'après la remarque 15.5, chaque (4 X n)-matrice C dé- 
finit à son tour d’une manière unique l’homomorphisme ®, i.e. 
la correspondance établie entre les homomorphismes q: À —$S et les 
(4 X n}-matrices C — (c;) est bijective. On vérifie directement 
qu'à la somme p" + ” de deux homomorphismes R — S correspond 
la somme C' + C" = (c'j + c';) des matrices correspondantes, tan- 
dis qu’au produit ÀAp de l’homomorphisme @: À —$S par le nombre 
À correspond le produit AC — (Ac;) de la matrice correspondante 
C = (c;) par le nombre À. Cela veut dire que l’espace Hom (R, S) 
est isomorphe à l’espace vectoriel de toutes les (4 X n)- 
matrices aux éléments réels. 

Les espaces considérés étant isomorphes, leurs dimensions sont 
les mêmes (voir le théorème 13.12). Mais la dimension de l’espace 
vectoriel de toutes les (4 X n)-matrices (aux éléments réels) est égale 
à kn. Ainsi, 

dim (Hom (AR, S)) = nk — dim R-dimS. 

Théorème 15.9. Soient o: R —S$S et D: S — T des homo- 
morphismes d'espaces vectoriels. Fixons dans l’espace R une base e,, ... 


.…, €n, dans l’espace S une base f,, ..., fx et dans l’espace T une 
base g1,..., g,. Supposons que dans ces bases la (k X n)-matrice C 
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correspond à l’homomorphisme ® et la (1 X k)-matrice D à l’homomor- 
phisme . Alors, la (1 X n)-matrice DC correspond (dans les mêmes ba- 
ses) à l’homomorphisme 1b © ®. 

Démonstration. Les éléments c; de la matrice C se déter- 
minent à partir des relations (15.4) et (15.7), tandis que les éléments 
de la matrice D se déterminent à partir des relations analogues 


P(fj)=0;=dig;+...+dig,, 1—=1, …..,) k. 
Il en découle 


R kR 
(op) (e;) = #(p(e;)) = % (a;) = Ÿ (2 fi) = 2 cp(fi)= 


k kR 1 kR LL 1 À 
= D cbi= D (ci D diga)= >» D iga= D (Di dit) Ja- 
1—=1 i=1 a=1 1=1 1 a=1 i=1 
Ainsi, 
l 
(pop) (e;)= 2 48e 


où les éléments de la (1 X n}-matrice Q@ = (q5}, i.e. de la matrice 
correspondant à l’homomorphisme °c , se définissent par la for- 
mule 


R 

œ ? 

Qi = » di ci. 
2— 


Mais cela veut justement dire que Q=— DC. 

Théorème 15.10. Soient R, S, T des espaces vectoriels et 
C: R—S un homomorphisme. Considérons les espaces vectoriels 
Hom (R, T) et Hom (S, 7) et pour un élément quelconque @E€ 
€ Hom (S, T°) (i.e. un homomorphisme S — T) posons E* (p) = poË 
(de sorte que Ü*(p) soit! un homomorphisme R — T, i.e. un élément 
de l’espace Hom (AR, T)). L'application &*: Hom (S, T) — Hom(AR, 7} 
ainsi obtenue est un homomorphisme. 

La démonstration s'obtient par une vérification immé- 
diate, de même que la démonstration de l’assertion suivante: 

Théorème 15.11. Soient R, S, T des espaces vectoriels et 
X: S — T un homomorphisme. Considérons les espaces vectoriels 
Hom (À, S) et Hom (R, T}), et pour un élément quelconque @ £ 
€ Hom (A, S) (i.e. un homomorphisme R —S) posons %,(p) = % ° 
(de sorte que %.,(p) soit un homomorphisme R —-T, i.e. un élément 
de l’espace Hom (AR, T)). L'application %,: Hom (R, S) — Hom (A, T) 
ainsi obtenue est un homomorphisme. 

En conclusion, considérons les notions d’espace dual et d’homo- 
morphisme adjoint. Soit À un espace vectoriel. Nous désignerons par 
D la droite numérique; elle représente un espace vectoriel de d i- 
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mensionunité (qui coïncide avec l’espace vectoriel arith- 
métique À! de dimension unité). Tout homomorphisme 
f: R —D s'appelle forme linéaire sur l’espace R. Par conséquent, 
la forme linéaire f: À — D fait correspondre à chaque élément 
x € R un certain nombre réel f (x), et 


f (x + 22) = f (01) + f (2), f (x) = M (x). 


L'ensemble de toutes les formes linéaires sur l’espace À, i.e. 
Hom (A, D) est, d’après le théorème 15.8 , un espace vectoriel de 
dimension dim À. Cet espace s'appelle espace dual (ou adjoint) de 
l’espace À et sera noté R*. Donc, 


R* = Hom (À, D), dim R* = dim 2. 


Soient maintenant À, S des espaces vectoriels et Ê: R —+S$S un 
homomorphisme. Alors, d’après le théorème 15.10, nous avons l’ho- 
momorphisme £*: Hom (S, D) — Hom (AR, D), i.e. l’homomorphis- 
me &*: S* > R*. Cet homomorphisme &* s'appelle dual (ou adjoint) 
de l’homomorphisme &. D’après le théorème 15.10, l’homomorphisme 
adjoint C* peut être déterminé de la manière suivante: il fait cor- 
respondre à chaque forme linéaire f: S$ D (i.e. à chaque élément 
de l’espace S*) la forme linéaire £* (f) — j + & définie sur l’espace 
R (i.e. un élément de l’espace R*). 

Enfin, signalons encore une méthode pour écrire des formes linéai- 
res, méthode souvent très commode. Soient À un espace vectoriel, 
RY son espace dual et supposons que x € R, f € RŸ. Puisque la for- 
me linéaire f est un homomorphisme f: R —D, la valeur de f (x) € 
€ D est bien définie: c’est un nombre réel. Convenons de désigner 
ce nombre réel par (x, f) et de l’appeler dans cette notation produit 
scalaire de l'élément x € R par la forme linéaire f € R*: 


Gœ, ÿ) = f (a). 
On déduit immédiatement de la définition les propriétés suivan- 
tes du produit scalaire: 
(Xi +, f)=(%4, f)+(X2 f) ; 
(X, fi fe) = (x, 1) + (x, fe); (15.10) 
Enfin, notons la proposition suivante, qui est également immé- 
diate d’après la définition du produit scalaire et de l’homomorphi- 
sme adjoint: 


Soient R, S des espaces vectoriels, L: R —$S un homomorphisme et 
CS: S* — RY l’homomorphisme adjoint. Alors nous avons la relation 


quels que soient les éléments xæ € R, fE S*. 


126 NOTIONS DE GÉOMÉTRIE MULTIDIMENSIONNELLE [CH. IE 


Théorème 15.12. Soient R un espace vectoriel, R* son dual 
et fs + + +» În Une base quelconque de l'espace RY. IT existe alors une 
base e,, . . ., e, de l’espace R telle que 


0 pour i=£ j; 
fi (ei) À pour i=j. 
Pour un tel choix de bases nous avons pour des éléments quelconques 


x = xle + ...+zr'e, ER, f—=y'f +... + Y"fn € R* 
(15.13) 


(x, f) = f (x) = xlyl +... + "y". (15.14) 


Démonstration. Définissons l’application q@: À —R" 
de l’espace vectoriel À dans l’espace vectoriel arithmétique À” en 
posant pour tout vecteur & € R: 

P (a) =, {1 (a), LE fa: (a)}. 
On vérifie immédiatement que l'application @ est un homomor- 
phisme. 

Montrons que le noyau Ker @ de cet homomorphisme est le sous- 
espace trivial. En effet, soit &, un vecteur non nul de l’espace À. 
Complétons le vecteur a, par les vecteurs @:, ..., a, jusqu’à une 
base a, @:, . . ., a, de l’espace À, et pour tout vecteur 


x = Ma + Vas + ... +Aa ER 


posons f(x) — À! On vérifie immédiatement que l’application 
f: R — D ainsi obtenue est une forme linéaire pour laquelle f (a;) — 
— 1. Mettons f sous la forme d’une combinaison linéaire des vecteurs 
de la base f,, ..., f,: 


f = fi + nt oi 
Il en découle que 
u'f, (as) +... + u" fa (a) = f (a) = 1. 


Par conséquent, au moins un des nombres f, (a;), . .., f, (@) n’est 
pas nul, et donc p (a,) = 0. Ainsi, aucun vecteur &, € R non nul ne 
pu appartenir au noyau Ker ®, i.e. Ker @ est un sous-espace tri- 
vial. 

Il découle maintenant du théorème 15.3 que dim (Im œ) — 
— dim À = n, i.e. Im ® — À”. Ainsi, ® est unisomorphis- 
m e de l’espace À sur l’espace RAR”. 

Notons e,,e:, . .., e, les vecteurs de l’espace À, satisfaisant aux 
relations 


(15.12) 


la relation 


P (e;) = {1, 0, 0, . 0, 0}, 
P (e2) Fe {0, 1 0, "#29 0, 0}, 


. +. ee ee 2 ee ee + ee + ee ee + + ee 


p (e,) = {0,0,0, ..., 0, 1}. 
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Les vecteurs e Cor es forment une base de l’es ace vectoriel R. 
ls 2 n 
De la relation 


{fi (ei), fa (ei), +: +, fn (ei)} = (e;) = {0, 0, ..., 4, ..., 0} 


(le chiffre 1 est à la i-ième place), on voit justement la validité des 
relations (15.12). En ce qui concerne (15.14), cette égalité découle 
directement des relations (15.12), (15.13). 

16. Espace vectoriel euclidien. Définition 16.1. L'espace 
vectoriel À s'appelle espace vectoriel euclidien s’il est muni d’une 
opération de multiplication scalaire des vecteurs, qui fait corres- 
pondre à chaque couple de vecteurs &, b € R lenombre réel ab, appelé 
produit scalaire des vecteurs &, b et satisfaisant aux axiomes sui- 
vants. 

Groupe IV:axiomes du produit scalaire. 

IV,. Le produit scalaire est commutatif, i.e. pour deux vecteurs 
quelconques a € R, LE R, on a la relation 


ab — ba. 


IV,. Le produit scalaire est distributif, i.e. pour trois vecteurs 
quelconques a ER, bER,CcER, nous avons la relation 


a (b + €) = ab + ac. 


IV,. Quels que soient les vecteurs a € R,dE R et le nombre réel À, 
on a la relation 


(Aa) bd = À (ab). 


IV,. Quel que soit le vecteur non nul a € À, le produit scalaire aa 
de ce vecteur par lui-même (que l’on appelle carré scalaire 
et que l’on désigne également par le symbole a?) est positif 


a? > 0 pour a 0. 


L'ensemble À, qui satisfait à tous les axiomes des groupes I, II, 
III et IV, s’appelle espace vectoriel euclidien de dimension n. 

Exemple 16.2. Considérons à nouveau l’espace vectoriel & 
de l’exemple 12.1 et introduisons dans cet espace le produit scalaire 
de vecteurs de la manière suivante. Soient À et B deux vecteurs 
quelconques (i.e. deux points du plan & ; à la place des points, on 


—+ 
peut considérer les rayons vecteurs correspondants O4, OB). Si au 
moins un de ces vecteurs est nul (i.e. coïncide avec le point O), le 
produit scalaire À -B de ces vecteurs est considéré nul (i.e. 0-0 — 
— 0.B = A.:0—0). Si les deux vecteurs À, B ne sont pas nuls 
(donc aucun des points À, B ne coïncide avec O), le produit scalaire 
de ces vecteurs se définit par la formule 


A.B= (long. OA) (long. OB) cos (AO0B) 
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(fig. 45); ici les symboles long. OA, long. OB indiquent la 10 n- 
gueu r usuelle des segments 04, OB. D’après le cours de géométrie 
élémentaire (ou de géométrie analy- 
À tique), on sait que le produit scalaire 
Ê ainsi défini satisfait aux axiomes 
IV,-IV,, i.e. le produit scalaire ainsi 
introduit transforme en un espace 
7 vectoriel euclidien (de dimension deux). 
Le même produit scalaire transforme 
Five. 4 l’espace © de dimension trois de l’exem- 
g. 45 k : 
ple 12.1 en un espace vectoriel eucli- 
dien de dimension trois. 
Exemple 16.3. Considérons l’espace vectoriel arithmétique 
de dimension n (voir l'exemple 12.2) et munissons-le d’un produit 
scalaire de la manière suivante: pour deux vecteurs quelconques 


CO D 1 
posons 
ay = ay +... + z'yr. 
On vérifie immédiatement que le produit scalaire ainsi introduit 
satisfait aux axiomes [V,-IV,. L'espace R° muni du produit scalaire 
indiqué est donc un espace vectoriel euclidien de dimension n. 
Déduisons maintenant quelques corollaires des axiomes du grou- 


pe [V. Avant tout remarquons qu’il découle des axiomes IV,, IV, 
(en vertu de l’axiome IV,) les relations 


(a + b) ce = ac + bc, a (1b) = À (ab). 


En nous servant de ces relations et des axiomes IV,, IV, nous obte- 
nons la relation 


p q pq 
L ne 
(D œai) (D Bd) = D D ap; (a;b)), (16.1) 
1i=1 3—=1 1=1 7—=1 
qui nous montre qu’en effectuant le produit scalaire de deux combi- 
naisons linéaires des vecteurs, on peut se servir de la « règle de mul- 


tiplication des polynômes » usuelle. 11 en découle (compte tenu de 
la commutativité IV,) que les formules 


(a + db) — a? + 2ab + b?, (a + b) (a — b) = a? — L? 
et les « règles de mise en carré d’un polynôme » 
P 9 D 
(> ui) = À afat+2 5 aa; (a;a;) 
i=1 i=1 i<i 


sont vérifiées. 
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Remarquons aussi que pour un vecteur quelconque a nous avons 
les relations 


Oa = 0, a0 — 0 


(qui découlent, par exemple, de l’axiome IV;). 

Définition 16.4. On appelle longueur du vecteur «a (appar- 
tenant à un espace vectoriel euclidien) le nombre V a°. Nous note- 
rons la longueur du vecteur «a par le symbole | & | ou par la même 


lettre que le vecteur lui-même mais en caractères ordinaires au lieu 
de caractères gras: 


[a|=a=y a. 
Il découle immédiatement de cette définition que a? = a? (pour 


tout vecteur «). 


Théorème 16.5. Quels que soient les vecteurs a, bd de l’espace 
euclidien R, nous avons les relations 


[ab | < ab, (16.2) 
[Aa l=121]a, 
[a+biI<lal+16! (16.3) 


(À étant un nombre réel quelconque). 

Démonstration. Considérons le vecteur za + b, où x 
est un nombre réel. D’après l’axiome IV, (et la relation 0? — O), le 
carré scalaire de ce vecteur est un nombre non négatif: 


(xa + db}? > 0. 
En ouvrant les parenthèses, nous obtenons alors (tenant compte des 
relations a? — a?, b? — b°?) 
ax? + 2 (ab) x + b > 0. 


L'inégalité ci-dessus est satisfaite pour tout nombre réel x, i.e. le 
trinôme du second degré 


a?x? + 2 (ab) x + b? 


ne prend (quel que soit x) que des valeurs non négatives. On en dé- 
duit que le discriminant de ce trinôme est non positif 


(2ab}? — 4a?b? < 0. 
Donc, 


(ab)? < a*b?, ou | ab | < ab. 
Ensuite, nous avons 
jaa|=V QaP=V Va=V Ma=|ha|=|xla 
(puisque -a > 0). 
9—01208 
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Enfin, en nous appuyant sur l'inégalité (16.2) déjà démontrée, 
nous obtenons 


ja+b|-V (a+ 0) =V a +2ab+BP<V a+ 2ab+b— 
=V (a+b}=a+b-|al+|v]. 


Remarque 16.6. Supposons que chacun des vecteurs a, à 
est non nul (de sorte que a >> 0, b >> 0). Alors la relation (16.2) peut 
se récrire sous la forme 

ab 


—ab<Lab<Lab, ou —1LS—<i. 


ab — 


On déduit de ces inégalités l’existence d’un angle o (satisfaisant 
aux inégalités 0 < p < n), pour lequel 


cos p= (16.4) 
ou 
ab = ab cos ®. (16.5) 


Par analogie avec la définition usuelle du produit scalaire (connu du 
cours de géométrie analytique ou élémentaire, comp. l’exemple 16.2), 
l'angle æ, défini par l'égalité (16.4) (i.e. satisfaisant à la relation 
(16.5)), peut être appelé angle de deux vecteurs a et b dans l’espace 
vectoriel euclidien. Cependant, en règle générale, on n'effectue pas 
le calcul des angles de deux vecteurs (suivant la formule (16.4)) en 
considérant l’espace vectoriel euclidien, et on préfère se servir di- 
rectement du produit scalaire. Mais, pour aider l’intuition géométri- 
que (et par habitude), on dit souvent que « les vecteurs a et b for- 
ment un angle aigu » (ou forment un angle droit, un angle obtus) 
selon que le nombre cos calculé par la formule (16.4), est positif 
(négatif, nul). Ainsi, 

les vecteurs a, b forment un angle aigu si ab > 0; 

les vecteurs a, b forment un angle obtus si ab < 0; 

les vecteurs a, b forment un angle droit s'ils sont tous les deux non 
nuls et ab = 0. 

Dans le dernier cas, on se sert plus souvent du terme vecteurs 
« orthogonaux ». À savoir, deux vecteurs &, b s'appellent orthogonaux 
si ab — 0 (dans ce cas, on ne stipule pas que ces vecteurs sont non 
nuls). Autrement dit, si les vecteurs «& et b sont orthogonaux, alors 
soit ils sont tous les deux non nuls et forment un angle droit, soit 
un de ces vecteurs est nul (et dans ce cas l’angle entre eux n’est pas 
défini). Par la suite nous nous servirons de cette terminologie. 

Un système de vecteurs e,, ..., e, dans un espace vectoriel 
euclidien À s'appelle orthonormé si les vecteurs e,, ..., e, sont 
orthogonaux deux à deux et sont tous de longueur égale à l'unité. 
Ainsi, le système de vecteurs e,, ..., e, sera orthonormé à condi- 
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tion que 
O0 pour ij; 
e;je;— 


1 pour i— j. 


(16.6) 


Théorème 16.7. Tout système de vecteurs orthonormé est li- 
néairement indépendant. 

Démonstration. Soit e;, ...,e, un système de vecteurs 
orthonormé. Supposons que 


ale + ... + aïe, = 0. (16.7) 


Calculons le produit scalaire des deux membres de cette égalité par 
le vecteur e; (où à est un des nombres 1, , k). Alors, en vertu de 
(16.6), nous obtenons «° = 0. Cela étant vrai pour tout i = 1, ; 
k, on voit donc que tous les coefficients du premier membre de 
l'égalité (16.7) s’annulent. Les vecteurs du premier membre de l’éga- 
lité (16.7) s’annulent. Les vecteurs e,, ..., e, sont donc linéaire- 
ment indépendants. 
Théorème 16.8. Tout système de vecteurs orthonormé e;, . .. 
., €r dans un espace vectoriel euclidien de dimension n (pour k < n) 
peut être complété jusqu’à une base orthonormée. IT en découle, en par- 
ticulier, que tout espace vectoriel euclidien de dimension n possède une 
base orthonormée Os Deer Co 
Démonstration. Soit e,...,e, un système orthonor- 
mé de vecteurs dans À, et k < n. Puisque les vecteurs e,, ..., ex 
sont linéairement indépendants (théorème 16.7), on peut, en vertu 
du théorème 13.8, compléter ce système de vecteurs par certains 


vecteurs fr, « « -, fn, de façon à obtenir une base 
€, ..., Ch) Tru, CC Ta 
de l’espace À. Il va de soi que cette basene sera pas, en géné- 
ral, orthonormée. Considérons les vecteurs e,, . .., ex, fr+1 (ils 
sont linéairement indépendants), et essayons de choisir des coeffi- 
cients @, ..., à@r, de façon que le vecteur 
fr touei+...+arer (16.8) 


soit orthogonal à tous les vecteurs e,, . . ., e,. Calculant le produit 
scalaire du vecteur (16.8) par le vecteur e; (où i est un des nombres 


1 , k) et égalant ce produit scalaire à zéro, nous obtenons 
(d’ après (16.6)) 


Ejfrut &=0, 
1.0. 
dimélha (et:44,.0). (16.9) 


Ainsi, si les coeflicients &,, ..., «, sont définis par les conditions 
(16.9), le vecteur (16.8), qu'on désigne dans ce cas par €”::1, sera 


9% 
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orthogonal à tous les vecteurs e,,..., e,. Remarquons que le vec- 
teur e:+ est non nul (en effet, le vecteur (16.8) n’est pas nul, car les 
vecteurs €, . .., er, €x+1 Sont linéairement indépendants). Mais il 
est possible que la longueur de ce vecteur diffère de l’unité. Posons 
| 

kR+1 — EM ER+1- 
Le vecteur e,+, est toujours orthogonal à tous les vecteurs e;, .…, ex, 
et sa longueur, comme on le voit aisément, est égale à l’unité. Ainsi, 
les vecteurs e,, ..., ex, e:+, forment un système orthonormé. 

Ainsi, si k << n, le système orthonormé e,, . .., e, peut être 
complété par un vecteur e,+, jusqu’à un système orthonormé, con- 
tenant À + 1 vecteurs. 

Si k+1<n, on peut de la même manière ajouter encore un 
vecteur et obtenir un système orthonormé de 4 + 2 vecteurs. Conti- 
nuant de la même manière, nous obtiendrons en fin de compte un 
système orthonormé e,, . .., e, den vecteurs, i.e. (en vertu du théo- 
rème 16.7) nous obtiendrons une base orthonormée de l’espace À. 

Théorème 16.9 Soit e,;, ..., e, une base orthonormée de 
l’espace vectoriel euclidien R de dimension n. Alors, pour des vecteurs 
quelconques 


x=xe +... +z'e,, y =y'e +... +y'e, 
de l'espace R, leur produit scalaire se calcule par la formule 
XYy = xlyl +... ay. 
En particulier, 


ja |==V (+... + (y. 


_ Ladémonstration découle directement des formules (16.1) 
et (16.6). | 

Corollaire 16.10. Deux espaces vectoriels euclidiens quel- 
conques de dimension n sont isomorphes entre eux. Autrement dit, si 
R et S sont deux espaces vectoriels euclidiens de dimension n, alors il 
existe un isomorphisme pm: R —$S, qui respecte le produit scalaire, i.e. 
xy —= p (x) p (y), quels que soient les vecteurs &, y € R. 

En effet, soient &@,, . .., a, une base orthonormée de l’espace R 
et b,, ..., b, une base orthonormée de l’espace S. 

En nous servant de ces bases, construisons l’isomorphisme @ : RS 
comme dans la démonstration du théorème 13.12. Puisque cet iso- 
morphisme conserve les coordonnées des vecteurs, d’après le théorè- 
me 16.9 on voit que l’isomorphisme œ respecte le produit scalaire. 

Définition 16.11. Soient À un espace vectoriel euclidien 
et À son sous-espace. Le vecteur x € R s'appelle orthogonal au sous- 
espace À s’il est orthogonal à chaque vecteur appartenant à ce sous- 
espace, i.e. xy —= 0 pour y € À. L'ensemble B de to us les vecteurs 
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x € R orthogonaux au sous-espace À s'appelle supplémentaire ortho- 
gonal au sous-espace À (dans l’espace R). 

Théorème 16.12. Soient R un espace vectoriel euclidien, À 
son sous-espace et B le supplémentaire orthogonal du sous-espace À. 
À lors B est un sous-espace qui est supplémentaire du sous-espace À. À son 
tour, À est le supplémentaire orthogonal du sous-espace B. 

Démonstration. Le sous-espace À est lui-même un espace 
vectoriel euclidien (étant un sous-espace de l’espace R) et, par con- 
séquent, d’après le théorème 16.8, on peut trouver pour À une base 
orthonormée e,, ..., ex, où k — dim À. D’après ce même théorè- 
me 16.8, le système de vecteurs e,, . .., e, peut être complété par 
les vecteurs e,:1,..., €, jusqu’à une base orthonormée e,, . . ., ex, 
Ep+s + + «» En de l’espace À, où n — dim À. Désignons par C le sous- 
espace engendré par les vecteurs ez+1, . . ., eh, i.e. le sous-espace 
comprenant tous les vecteurs de la forme œy+jepr+1 + . . . + œnen. 
Puisque chacun des vecteurs ez11, . . ., e, est orthogonal à tous les 
vecteurs e,, . . ., er, il sera orthogonal également à toute combinai- 
son linéaire de ces vecteurs, i.e. à tout vecteur x € À. Mais alors tout 
vecteur y = Gp+16p+1 + ... + &,e, du sous-espace C est ortho- 
gonal lui aussi à un vecteur quelconque x € À, i.e. y € B. 

Nous avons ainsi démontré l'inclusion CE B. 

Réciproquement, si le vecteur 


= ei... + per + Unhenrs + ee + One | 
appartient à l’ensemble PB, i.e. il est orthogonal au sous-espace À, 
on a ze, = 0, ..., £e, = 0, d’où l’on déduit que, —...— ax = 
— 0, et par conséquent 

8 = UnHepr +... +onen EC. 

Ainsi, BE C. Nous voyons que B = C, i.e. B est le sous-espace en- 
gendré par les vecteurs ez:+1, . . ., e,. D'où l’on peut déduire sans 
difficulté toutes les assertions du théorème. 

GCorollaire 16.13. Soit À un sous-espace de l'espace vecto- 
riel euclidien R. Alors, chaque vecteur x € R se met d’une manière uni- 
que sous la forme & = %1 + %2, où &1 € À, et le vecteur x, est orthogo- 
nal au sous-espace À (i.e. appartient au supplémentaire orthogonal B 
du sous-espace A). Le vecteur x, s'appelle projection ortho- 
gonale du vecteur x sur le sous-espace À. 

La démonstration découle immédiatement des théorè- 
mes 16.12, 14.11. 

Corollaire 16.14. Soit À un sous-espace de l'espace vecto- 
riel euclidien R. Pour chaque vecteur x € R notons n (x) la projection 
orthogonale du vecteur x sur le sous-espace A. L'application obtenue n 
de l’espace R dans lui-même (que l’on appelle projection or- 
thogonale sur le sous-espace À) est un homomorphisme. On a dans 
ce cas Im x — À, Ker x — B, où B est le supplémentaire orthogonal 
du sous-espace À. 
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La démonstration découle immédiatement du théorè- 
me 15.7, du corollaire 16.13 et de la définition 15.6. 

Théorème 16.15. Soient R, S des espaces vectoriels euclidiens 
et p: R —S un homomorphisme. Il existe alors un nombre M > 0 
tel que |q(a)|< M | a |, quel que soit a € R. 

Démonstration. Soit e,, ..., e, une base orthonormée 
de l’espace R. Posons 


M = |@l(e) +... + 1(e) |. 
Alors, pour tout vecteur 
a = axe + ...+z'e, ER 

nous avons 

= VRPEVGP TE. EE =al i=1,...,n, 
et, par conséquent, 
pOul—-fpitr'e+...+ae,)|[=frtp (es) +... +zp (er) |< 
<|z'p(es)|+...+frp(e)l=lztflp(e)1+... +1 tlp(e)l< 
<|al-1p(e;)|+...+1allp(e)|1= 

=|al-|p(e:)|+...+{p(exl)=M (a). 


En conclusion, considérons l’expression des formes linéaires dans 
les espaces vectoriels euclidiens. 

Théorème 16.16. Soit f une forme linéaire quelconque, défi- 
nie sur l’espace euclidien R. II existe alors un vecteur unique b € R qui 
possède la même propriété que f, i.e. 


f (x) = bx 
(quel que soit x € R). Le vecteur b s'appelle gradient de la forme 
linéaire f ; on le désigne par grad f. 
Démonstration. Introduisons dans l’espace À une base 
orthonormée e,, . .., e, (où nr — dim À) et posons 


d: — Î (e:), . Zn = Î (eh). 
Ici ay, . .., a, sont des nombres réels. Notons par b le vecteur 


D ee d1€: + . —+ AnEne 
Si maintenant 
x = X'e + ... + ze, 


est un vecteur quelconque de l’espace À, nous avons 
f(æ)=f(rtle +... +zr'e,) — 
+ 21 (e:) un CE + U, (en) = x'a, + . + t'a, — 


(voir le théorème 16.9). 
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Ainsi, nous avons trouvé le vecteur b cherché. Démontrons son 
unicité. Soit b’ un autre vecteur jouissant de la même propriété: 


f (x) = dx, f (x) = b'x, quel que soit x E R. 
Alors, bx — b'x — 0, i.e. 
(db — d')x = 0. 


Cette relation est vérifiée pour tout x € À. En substituant, en par- 
ticulier, æ = bd — b', nous obtenons: (bd — b'}? — 0 d’où b — b' — 
— 0, ou bien b — b'. 

Théorème 16.17. Soient R un espace vectoriel euclidien et R* 
son dual. L'application o: R* — R, définie par la formule 


p () = grad ÿ, f E R*, 
est un isomorphisme de l'espace R* sur R. 
Démonstration. Soient f,, f, € R*, ïi.e. f, et f, sont 
des formes linéaires sur À. Posons 


P (1) = 1, P (a) = Vs, je. D, — grad j,, db, — grad 2. 
D’après le théorème 16.16, nous avons 
f1 (x) = b, (x), f, (x) = b,x, quel que soit x € À. 
Par conséquent, 
1 + fo) (oc) = fa (x) + fa (x) = dx + D: à — (db, + 02) «, 


ie. grad (f + f,) = b, + bd, Autrement dit, ©@ (f1 + fo) = 
= @(f,) + p(f,). On démontre d’une manière analogue que 
p (Aÿ) = À (f). L'application œ est donc un homomorphisme. 

Il reste à démontrer que l’application œ est bijective. Soit b € À. 
Posons f (x) — bx. D'après les axiomes IV,-IV, l'application f jouit 
des propriétés (13.10), i.e. elle est une forme linéaire sur R. Il est 
clair que grad f — b. Ainsi, pour tout vecteur b € À, on peut trouver 
une forme f, telle que  (f) = b, i.e. l’application œ est une surjection 
de R* sur À. 

Supposons maintenant que © (f,1) — @(f.). Alors (@ étant un 
homomorphisme) 


P (ai — fe) = P (1) — p (2) = 0, ie. grad (f1 — fs) — 0. 


Cela veut dire que (f, — f,) x — 0x — 0, quel que soit x € À, 
1e. f, (x) — f, (x) = 0, ou bien f, (x) = fo (x). Ainsi, si p (f1) — 
= @ (f), alors jf: = fa. 

Remarque 16.18. Il va de soi que le fait de l’isomorphisme 
des espaces R* et À n’est pas nouveau: il est vérifié pour tout 
espace vectoriel de dimension nr quelconque (voir le théorème 13.12 
et la relation dim R* — dim À à la fin du n° 15). Toutefois, la pré- 
sence du produit scalaire dans un espace vectoriel euclidien permet 
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d'établir un isomorphisme entre les espaces R* et R, indépendant 
du choix des bases par rapport à ces espaces; c’est justement l’iso- 
morphisme qui a été construit dans les théorèmes 16.16, 16.17. 

Remarquons que cet isomophisme transforme le produit sca- 
laire, considéré à la fin du n° 15, en produit scalaire donné dans A. 
Autrement dit, si À est un espace vectoriel euclidien, on a pour deux 
éléments quelconques x € R, f € R la relation 


(œ, f) = xp (ÿ) 
(où œp (f) = grad f); ici, le premier membre représente le produit 
scalaire considéré au n° 15 et le second membre, le produit scalaire 
donné dans l’espace 2. 


$ 5. Géométrie euclidienne 


17. Définition de l’espace affine. On peut donner aux proprié- 
tés des espaces vectoriels, considérées au paragraphe précédent, une 
interprétation géométrique dans l’espace vectoriel Z (voir l'exemple 





Fig. 46 Fig. 47 


12.1). Par exemple, chaque droite de l’espace Z qui passe par le 
point © est un sous-espace de dimension unité, et chaque plan passant 
par ce point est un sous-espace de dimension deux. Alors, si une 
droite n’est pas située dans ce plan (fig. 46), elle sera le supplémen- 
taire direct de ce plan, tandis que si la droite est perpendiculaire au 
plan, elle sera son supplémentaire orthogonal. Une interprétation 
géométrique simple peut être également donnée à la projection or- 
thogonale (fig. 47) et à d’autres notions considérées. 

Néanmoins, les notions introduites et les théorèmes démontrés 
sont plutôt de caractère algébrique que géométrique. Cette particu- 
larité s’est manifestée, dans l’étude de l’exemple 12,1, par le fait 
que nous avons fixé dans le plan & (ou dans l’espaae ©) un 
certain point ©, et nous n’avons considéré que les vecteurs (« seg- 
ments orientés » ou bipoints) issus du point O (ou, comme on dit par- 
fois, des vecteurs « liés ») et en qualité de sous-espaces nous n’avons 
considéré que les droites et les plans passant par O. Tout ceci n’est 
aucunement dicté par les propriétés géométriques du plan 
(ou de l’espace) ; au contraire, du point de vue géométrique tous les 
points sont équivalents et le choix d’un point © aux propriétés ex- 
ceptionnelles semble plutôt artificiel. De plus, en géométrie il est 
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caractéristique de considérer non seulement les vecteurs, mais aussi 
les points; non seulement les droites et les plans passant par le 
point ©, mais aussi les droites et les plans qui ne contiennent pas 
ce point. Autrement dit, l’espace vectoriel diffère de l’idée de 
l’espace qui nous est familier du cours de géométrie (élémentaire ou 
analytique). Dans cette section nous décrirons la notion d’espace 
affine qui répond pleinement à nos conceptions intuitives sur 
l’espace géométrique en ce qui concerne toutes les propriétés, sauf 
les propriétés métriques. Celles-ci seront décrites au n° 21. 

Pour rendre plus naturelle et plus compréhensible la définition 
de l’espace affine, proposée ci-dessous, rappelons qu’en géométrie 





B 
La 
dé 
> dé 
dé 
ne dé 
Ao 
a 
Û 
Fig. 48 Fig. 49 


(élémentaire ou analytique) on considère, en plus des vecteurs « liés » 
ou bipoints (d’origine O), tout aussi bien des vecteurs ditslibres, 


— 
le point d'application À de tout vecteur AB « égal » à un vecteur 
donné a pouvant être choisi de façon arbitraire (fig. 48). Autrement 
dit, si un point À et un vecteur a sont définis on peut trouver un point 


B tel que AB = a. Nous avons l'habitude de s’imaginer (et de 
représenter) les points et les vecteurs sur un même exemplaire du 
plan (ou dans un même espace). Néanmoins, nous gagnerons en clar- 
té en se représentant d e u x exemplaires du plan situés, pour ainsi 
dire, côte à côte; sur un de ces exemplaires fixons le point © et repré- 
sentons des vecteurs liés et sur l’autre les points et les vecteurs libres 
(fig. 49). L’exemplaire du plan contenant les vecteurs liés sera noté 
R ; c’est l’espace vectoriel de dimension deux, considéré dans l’exem- 
ple 12.1. Le deuxième exemplaire (sur lequel on représente Les points 
et les vecteurs libres) sera désigné par X. Le plan X ne possède aucun 
point fixé (i.e. tous ses points sont équivalents); c’est justement le 
plan « géométrique ». Pour tout vecteur «& (i.e. tout élément de l’es- 
pace vectoriel À) et tout point À € X, on peut trouver dans le plan 


— 
X un point B tel que le segment orienté AB, joignant dans le plan X 
les points À et B, est « égal » au vecteur a : 


+ 
AB = a. 
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Les considérations exposées ci-dessus sont à la base de la défi- 
nition axiomatique de l’espace a f f i n e, que nous énoncerons de la 
manière suivante. 

Soient À un espace vectoriel de dimension n et X un certain en- 
semble dont les éléments sont appelés points. Le couple (R, X) s’ap- 
pelle espace affine de dimension n si à chaque couple de points 


—— 
A,BE€EX on fait correspondre un vecteur noté AB (et appartenant à 
l’espace vectoriel R), de sorte à satisfaire les axiomes suivants: 
Groupe V:axiomes de l’application des 
vecteurs. 


V,. Pour tout point À € X et tout vecteur a € R, il existe un point 


= 
BEX, tel que AB = a (le choix de ce point B s'appelle application du 
vecteur a au point À). 
V,. Quels que soient les points À, B,CE X,on a la relation 
— —>  — 
AB+BC1ICA—0. 


—> 

V,. Si pour les points À, B € X on a la relation AB — 0, alors 
les points À et B se confondent. 

Passons à l’étude des faits les plus simples qui se déduisent des 
axiomes de l’application des vecteurs. 

Théorème 17.1. Pour un point quelconque À € X, on a la 


ss 
relation AA = 0. Pour deux points quelconques À, BE X, on a la 


—> — 
relation AB — —PBA. 

Démonstration. Pour trois points qui se confondent 
A = B — C, nous avons, en vertu de l’axiome V,, 


—>  — — 
AA + AA + AA—0, 
LS 
ou bien 344 — 0. Le produit de cette égalité par _- nous donne 
— 
AA = 0. 


Remplaçant maintenant dans l’axiome V, le point C par le 
point À, nous obtenons 


— >  — 
AB+ BA+AA—0, 


— 
d’où, en vertu de la relation AA — 0, déjà démontrée, nous trou- 
vons 


— — — — 
AB+BA—0O, ïi.e. AB— — BA. 


orème 17.2. Pour des points quelconques À,, A3, ... 
€ À, on a la relation 


ue Sn 
A149 + 4343 +... + An 148 = A4. 
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La démonstration s'obtient par récurrence à l’aide de 


— — 
l’axiome V, et de la relation AB — —BA. 

Théorème 17.3. Si les nombres réels a!, ..., à jouissent 
de la propriété 


d'+ ,,.+af — 0, 


alors pour des points quelconques Q, Q”, A,, ..., À, on a la relation 


— — ——— —— 
MO A, +...+aQ04;,= atQ'A,+...+aQ"'A.. 


La démonstration est immédiate d’après les relations 


— _ _—— 
QA;—Q0Q' +0'A,;, i = À, ss Se 


En nous basant sur let héorème 17.3, nous introduirons maintenant 
des notations qui seront commodes par la suite. Soient À!, ..., À° 
des nombres réels qui satisfont à la condition 


MH ...+N = (17.1) 
et soient Q, À, À,, ..., A, € X des points tels que l’on ait l’éga- 
lité 

— —— —> 
QA— OA, — ...—)QA;—0. (17.2) 


La somme des coefficients du premier membre de (17.2) étant nulle, 
on a, d’après le théorème 17.3, pour t o u t point Q’ € X la relation 


—> —> ——— 
Q'A—MQ'A—...—NQ'A—0. 


Autrement dit, si l’on a l’égalité (17.2), la relation (17.1) étant 
satisfaite, cette égalité n’a en fait rien à voir avec le choix du point 
Q; elle exprime seulement une certaine relation entre les points 
À, À, ..., A4. Dans ce cas nous conviendrons d’écrire 


A= NA +... + AA (17.3) 


Ainsi, nous écrirons la relation (17.3) seulement dans le cas où 
l'égalité (17.1) est vérifiée, et nous interpréterons la relation (17.3) 
comme suit: pour un certain point (et donc pour tout point) O0 € X, 
on à la relation (voir (17.2)) 


—> — _—> 
QA=MOA,+...+N0A.. (17.4) 
Théorème 17.4. Soient M, ..., À des nombres réels satis- 


faisant à la condition (17.1) et À,, ..., A, € X des points arbitraires. 
Il existe alors un point et un seul À € X qui satisfait à la relation (17.3). 

Démonstration. Choisissons (et fixons) un point arbi- 
traire O0 € X. L'égalité (17.3) est, par définition, équivalente à la 
relation (17.4) (la condition (17.1) étant satisfaite). Nous devons donc 
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démontrer l’existence et l’unicité du point À qui satisfait à la rela- 
tion (17.4). Tous les points Q, 4,, ..., À, et les nombres A, | 

, À° étant connus, le second membre de la relation (17.4) repré- 
sente un vecteur bien défini; notons-le &. Ainsi, il s’agit de dé- 
montrer l’existence et l’unicité du point À qui satisfait à la relation 


——> 
QA=a, 


le point Q étant fixé. L'existence d’un tel point À découle alors di- 
rectement de l’axiome V,. Démontrons l’unicité. 
Soient À, A” deux points qui satisfont à la condition mentionnée, 


— — — = — 
i.e. QA = a, QA' = a. Alors, QA = QA'et, par conséquent, AA" — 


— —> —>  — 
— AQ + Q04' — —QA+0Q4"— 0. Il découle maintenant de l’axiome 
V, que les points À et A” coïncident. 
Exemple 17.5. Introduisons la notion de segment dans un 
espace affine. Soient À et B deux points distincts de l’espace X. On dit 
que le point C C appartient au segment [A, B] si 


AC =AAË les vecteurs AB et AC sont liés par la rela- 
(4@£A</) tion (fig. 50) 





— — 
r AC—NAB, où OAI. (17.5) 


Il est clair que chacun des points À, B appar- 
Fig. 50 tient au segment [4, B]; on les appelle extrémi- 

tés du segment [4, B1. Le point C pour lequel 

le nombre À dans la relation (17.5) est égal à #48 A COUR milieu de 


segment [4, B]; il jouit de la propriété suivante: AC = = CB. 

Il s'avère parfois nécessaire de considérer le segment [4, B] sans 
savoir à priori si les points À et B sont distincts. Pour de tels cas, il 
est commode d'introduire la notion de « segment » dont les extré- 
mités coincident À — B, en supposant par définition qu’il consiste 
en un seul point À. On dit que ce segment est dégénéré. Cette con- 
vention permet de considérer le « segment [4, B] » pour deux points 
quelconques À et B, distincts ou non. 

Soit C un point arbitraire du segment [4, B]. Considérons un 
point arbitraire Q de l’espace X. Alors 


—_— —>  — > —  — 
AC=QC—QA, AB=Q0B—QA 


et, par conséquent, la relation (17.5) (qui est vérifiée, car CE (A, BD 
peut s’écrire 


—  — —>  — 
QÜ—QA=1(OB—QA), 01, 
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d'où 
— — — 
QC—(1—à)Q0B+AQ4, 0LA<1, 
ou, autrement, 
C=({—An)A+AB, 0LAL1. (17.6) 


En effectuant les calculs dans l’ordre inverse, nous pouvons déduire 
la relation (17.5) à partir de la relation (17.6). Par conséquent, si le 
point C satisfait à la relation (17.6), on a C € [A, B]. Aïnsi, la pro- 
position suivante est vraie: 

Le point C appartient au segment \A, B] si, et seulement si, on a la 
relation (17.6). 

Si les points À et B sont distincts, on appelle tous les points du 
segment [4, B], sauf les points extrêmes À et B, points intérieurs 
de ce segment. L'ensemble de tous les points intérieurs du segment 
[A, B] est noté (4, B) et s'appelle segment ouvert aux extrémités À 
et B. Ainsi, les extrémités À et B n'appartiennent pas au segment 
ouvert (4, B). Si l’on ajoute au segment ouvert (4, B)un seul de 
ces points extrêmes À et B, on obtient le segment semi-ouvert : (A, B) 
ou (4, B]. 

Soient As, A1, . . ., Az € X. Si l’un quelconque de ces points, 
par exemple À,, s'exprime en fonction des autres points de la manière 
suivante (voir (17.3)): 

Ao = MA +... + A4, où M4... HAr— 1, 


nous dirons que les points 4,, 4, ..., A, sont liés. Si aucun de ces 
points ne s'exprime en fonction des autres points, les points 
À 9, Aus + +. AZ sont dits libres. 

Théorème 17.6. Les points A,, AÀ,,..., AkEX sont 


— — 
libres si, et seulement si, les vecteurs À, À,, ..., A, A, sont linéai- 
rement indépendants. 
Démonstration. Supposons que les points As, À, ... 
..., AZ sont liés. Alors l’un d’eux, mettons À;, s'exprime en fonction 
des autres points: 


À; = NA + MA, + ... + A4, 
où dans le second membre le point À; n'apparaît pas (i.e. À? — 0) 
et l'ona NM +A+H ,.. + A4 — 1. Cela veut dire (voir (17.4)) que 


= — — ee 

QAi;= NM QA5+ NOQA: +... +2 Q4:, 
où © est un point arbitraire de l’espace X. En particulier, pour Q — 
A, nous obtenons 


_—— ——— —— 
A4; — M 4,4: | ... LAFA À: 
: — — 
où À — 0. Ainsi, les vecteurs A,4,, ..., A,A% sont linéairement 
dépendants. 


st 
— 
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Li —> —> 
Réciproquement, supposons que les vecteurs A4, . .., AoÂk 


sont linéairement dépendants. Alors l’un d’eux, mettons Ad; 
s'exprime en fonction des autres vecteurs: 


AÀ,=MAA +. LNAA,. 


où a — 0. Posons À? = 14 — À1 — = pe, Monet AVAL 
. + AE = 1 et l'on a la relation: 


n > 
A À — NA A MA, A, + .... — KA ;A;: 
i.e. la relation (17.4) pour Q — À,. Donc, 
À ; = A4, —- MA, + + —— LAS. 
Comme À — 0, cela signifie que le point A; s'exprime en fonction 
des autres points, i.e. les points 4,, À,, ..., A, sont liés. Le théo- 


rème est démontré. 
Soient æœ!, ..., à«° des nombres réels satisfaisant à la relation 


alt ,.,.+<as—0 (17.7) 


et À,, ..., À, des points quelconques de l’espace X. Alors, en 
vertu du théorème 17.3, le vecteur 


— — 

a—=@OA,;+...+aQAÀ, (17.8) 

ne dépend pas du choix du point Q. Convenons de noter ce vecteur 
a par 


a=aœA,; +... +a‘A., (17.9) 
soulignant par cette notation que le vecteur «a dépend seulement des 
nombres œ!, ..., a° et des points À,, ..., À, € X. Autrement dit, 


nous nous servirons de la notation (17.9) seulement dans le cas où la 
relation (17.7) est vérifiée; dans ce cas, la notation (17.9) signifie la 
même chose que (17.8). 

Soient, en particulier, deux points À et B de l’espace X. Consi- 
dérons le vecteur 


a=B—1, (17.10) 


i.e. le vecteur 1B + (—1) À (ici la somme des coefficients est nulle, 
i.e. la condition (17. De est oo L'égalité (LT: EU, signifie par 


définition que &a — D — 4. Or, QB — QA = = AB. Ainsi, nous 
avons 


as 
AD= PA, (17.11) 


—> 
i.e. d’après les conventions adoptées, le vecteur AB (voir les axiomes 
V,-V,) peut également être noté par B — À. 
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D'après ce que l’on vient de dire, on se servira également de la 
notation de forme A +a,où AE X,aE€R. La signification de cette 
notation est la suivante: l’expression B — À + a veut dire, par 

— 


définition, la même chose que a = B — À, i.e. a — AB. Ainsi, 
l'écriture B — À + a signifie que B est le point obtenu par l’appli- 
cation du vecteur &a au point À (voir l’axiome V.). 
Théorème 17.7. Soit (R, X) un espace affine. Fixons dans 
X un certain point O. Convenons d'appeler vecteurs tous les points de 
l’espace X et définissons l'addition des vecteurs et la multiplication des 
vecteurs par des nombres réels en acceptant les conventions suivantes : 
nous écrirons C=A+BsiC—A+B—O (A, B, CE X), 
nous écrirons D = ÀA si D = A +(1—)0 (4,DE X). 
Îl s'avère que les opérations ainsi introduites munissent X d'une struc- 
ture d'espace vectoriel isomorphe à R. L'application @: X —R défi- 


—— 
nie par la formule ® (4) — OÀ est un isomorphisme. 
Démonstration. Notons avant tout que l’application 
PE 


p: X —+R, définie par la formule p (A) — OA, est une bijection 
(ce qui est immédiat d’après les axiomes V, et V.,). Par conséquent, 
pour démontrer le théorème, il suffit d'établir les relations 


p(4 + B) = (4) + @p(B), ® (44) = Ap (4), (17.12) 


qui montrent que X satisfait aux axiomes des groupes I et II (ces 
axiomes étant satisfaits dans R), ïi.e. il sera alors démontré, en même 
temps, que X est un espace vectoriel et que œ est un isomorphisme. 

OU te — À 20 B, ïi.e. C— A +B—O, signifie que 


QC = = ÇA + QB — 00 pos tout por DA € X. En particulier, pour 


Q — 0, nous obtenons OC — — OA + OB, i.e. op(C) = p (4) + 
+ (B). Aïnsi, si C = À + B, alors (C) — p (4) + p (B), ce 
qui établit la première des relations (17.12). 

Ensuite, l’écriture D = 4, i.e. D — ÀA + (1 — À) O, signifie 


> — — 
que QD = ÀQA + (1 — À) OD pour tout point Q € X. En parti- 


— — 
culier, pour Q = 0, nous obtenons OD = 104, i.e. p (D) — À (4). 
Ceci démontre la deuxième relation de (17.12). 

Remarque 17.8. Ainsi, si nous avons choisi dans l’espace X 
un point fixe O, alors X devient un espace vectoriel. Dans ce cas, la 
combinaison linéaire 


MA +... + AËA, 


a un sens, quelle que soit la somme des coefficients À! + ... + A”: 
cette combinaison linéaire peut être interprétée comme 


SC RE 5 
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où maintenant la somme des coefficients est égale à l’unité. C’est 
justement de cette manière que nous avons interprété la somme À + 
+ B (comme À + B— 0) est le produit AA (comme AA + 
+ (1 — À) O0) dans l’énoncé du théorème 17.7. Remarquons aussi 
que la définition de la somme dans le théorème 17.7, i.e. la conven- 
tion de prendre pour somme des points À et B le point C — À + 
+ B — O, peut s’écrire sous la forme C + O — À + B, ou bien 


1 , À 1 Î 
2 go as 


ce qui veut dire que le milieu du segment [O, C] coïncide avec le 
milieu du segment [4, B]. Par conséquent, les opérations introduites 
dans le théorème 17.7 sont en accord parfait avec l'exemple 12.1. 

Remarque 17.9. La conception de l’espace affine exposée 
dans ce numéro était fondée sur la considération d’un espace vecto- 
riel À et d’un espace ponctuel X distincts. Mais il est possible 
de faire coïncider ces deux espaces. A savoir, si l’on a un espace 
vectoriel À de dimension n, on peut convenir de considérer les élé- 
ments de l’ensemble À (les vecteurs) comme étant en même temps 
des « points », i.e. convenir d’appeler les éléments de l’ensemble RÀ 
tantôt vecteurs, tantôt points, selon les circonstances. Dans ce cas, 
si À, B sont deux « points » (i.e. À, B € R), alors nous entendons par 


—> 
« vecteur » AB la différence A — B (cf. (17.11)), bien définie dans À, 
R étant un espace vectoriel. 

Passant maintenant aux notations usuelles des éléments de l’es- 
pace vectoriel (@, b, €, . .. au lieude À, B, C, . . .), nous décrirons 
alors une opération d'application des vecteurs de la manière sui- 
vante. Faisons correspondre à chaque couple de points a, bE R le 
vecteur b — «a € R, que nous appellerons vecteur joignant les points 
a et b. Dans ce cas l’axiome V, signifie que pour tout point @ € R et 
tout vecteur € € À, il existe un point æ € R tel que le vecteur qui 
joint les points a et x est égal à €, ie. æ—a—cou x —=a+c. 
Ainsi, dans ce cas, l’application du vecteur € au point a signifie le 
passage au point &æ + c. Nous voyons qu'avec cette interprétation 
des vecteurs et des points l’axiome V, est vérifié dans un espace vec- 
toriel quelconque. On vérifie tout aussi simplement les axiomes 
V, et Va. 

Ainsi, pour l'interprétation indiquée, tout espace vectoriel se 
transforme en même temps en un espace affine, i.e. on considère les 
points et les vecteurs dans un même ensemble À. 

Une autre variante de l’interprétation unifiée (i.e. l’étude des 
points et des vecteurs choisis dans un même espace) peut être obte- 
nue d’après le théorème 17.7 : le choix d’un point fixe O € X trans- 
formant X en un espace vectoriel isomorphe à À, on peut limiter 
notre examen à un seul ensemble X en y considérant aussi bien les 
points que les vecteurs. 
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L'interprétation séparée (ensembles À et X) est évidemment plus 
simple et plus claire. Dans la suite le lecteur peut choisir l’un quel- 
conque de ces points de vue. Plus exactement, nous parlerons de 
pointset de vecteurs dans les ensembles À et X respecti- 
vement (interprétation séparée) mais le lecteur peut, s’il le veut, 
considérer que À et X coïncident. 

18. Plans dans l’espace affine. Soit (A, X) un espace affine. 
L'ensemble P& X s'appelle plan (ou variété linéaire) si pour des 


points quelconques 4,, ..., À, € P et des nombres réels quelcon- 
ques pl, ..., u° satisfaisant à la condition pl + ... +u° = 1,le 
point 4 = ulA, + ... + u°4, appartient également à l’ensemble 


P. Si dans le plan P on peut trouver r + 1 points libres, mais pas 
plus, le plan P s’appelle plan de dimension r. Si l’espace affine X 
est de dimension », les plans de dimension n — 1 s'appellent égale- 
ment kyperplans. Enfin, les plans de dimension unité dans l’espace 
affine s'appellent lignes droites (ou simplement droites). 
Théorème 18.1. Soit PC X un certain plan de dimension r. 


— 

Alors l’ensemble L, de tous les vecteurs AB, où À, B € P, est un sous- 
espace de dimension r de l’espace vectoriel R. Ce sous-espace s'appelle 
sous-espace directeur du plan P. 


—> 
Démonstration. Soient a, bEL,, ïi.e. a — AB, bd — 
+ 
— CD, où À, B, C, D € P. Puisque P est un plan, Île point 
E=B+D—C (18.1) 
appartient au plan P. L'égalité (18.1) signifie que 
> > —  — 
QE -—QB+0D—-QC 
pour tout point Q € X. En particulier, pour O0 — A on a 
—> —  — —> —  — 
AE = AB + AD — AC = AB + CD = a + b. 


ne 
Puisque À, EE P, on a AE EL,, i.e. a + bEL,. Ainsi, si 
a, bd EL», alors a + bE L». 


ER 
Supposons maintenant que «a € Lp, i.e. «a = AB, où À, B€P 
et que À est un nombre réel quelconque. Puisque P est un plan, le 
point 
F = (1 — à) 4 + AB (18.2) 
appartient au plan P. L'égalité (18.2) signifie que 
— —> — 
QF—(1— 1) 04 +20B 
pour tout point Q € X. En particulier, pour Q — À nous obtenons 
— — — — 
AF = (1— À) AA +2AB —2AB = la. 
10—01208 
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_ 
Comme A,F EP, on a AFEE,, ïi.e. Àa € L,. Ainsi, si «a € Lp, 
alors Àa € L,. Par conséquent, L> est un sous-espace. 
Puisque dim P = r, il existe des points libres A,, À,, ... 
. A, E P. D'après le théorème 17.6, les vecteurs 


— —_——> 
A544, ..., Ao4r 


sont linéairement indépendants. Mais tous ces vecteurs appartien- 
nent à L. Ainsi, nous avons trouvé dans L, r vecteurs linéairement 
indépendants et donc dim ZL» >r. 

Supposons enfin que e,, ..., e, est une base du sous-espace L,, 
où s — dim ZL?. On peut alors trouver dans P des points B,, 

, Bas Cu + .…, C, tels que 


— _ 


Considérons un point A, € P. Pour chaque i — 1, ..., s le point 
A; = A9 + C; — B; appartient au plan P. Cette égalité signifie que 


— — = == 
QA;=QA45+ QC; —0QB; 
pour tout point Q € X. En particulier, pour Q = À, nous obtenons 
>  — 
A À, — A À, + AC: A AC, — A,B;— B;C;=—e;. 
Ainsi, nous avons trouvé dans P des points À4,, 4,, ..., À, tels que 
—— —— 
AA = Eu ..., A4: = 64. 
Les vecteurs e,, . . .,e, étant linéairement indépendants, les points 
À 9» A, + - ., À, Seront libres d’après Le théorème 17.6. Il en résulte 
que sr (puisque dim P = r), i.e. dim Lp r. Les inégalités 
démontrées entraînent dim Lp = r. 

Théorème 18.2. Soit PE X un certain plan et LCR 
son sous-espace directeur. Soient, d'autre part, €, . .., e, une base 
du sous-espace L» et À, un point du plan P. Le point À € X appar- 
tient au plan P si, et seulement si, il existe des nombres réels À, | 

, À tels que 

A = Apte + ... + \'e,. (18.3) 


. Démonstration. L'égalité (18.3) signifie par définition 
que 
——> 
AA =Me;+...t+ie, (18.4) 
is 
(voir p. 143). Si À € P, alors A,A € L», i.e. on peut trouver des 


nombres réels Àl, ..., À”, pour lesquels on a la relation (18.4) et 
donc (18.3). 
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Réciproquement, supposons satisfaite l'égalité (18.3) et donc 


— 
(18.4). Alors le vecteur a = 4,4, en tant que combinaison linéaire 
des vecteurs e,, ..., e,, appartient au sous-espace LA. On peut 


—— 
donc trouver des points B, C € P tels que BC = a. Posons 
D = A, + C — B. (18.5) 


Le point D appartient au plan P du fait que A,, B,C € P. L'éga- 
lité (18.5) signifie que 


—> — —  — 
QD—QA5+QC—QB 
pour tout point QE X. En particulier, pour Q = À, nous obtenons 


——> 


 nÉR => > —> 
AD — AoC — AB — BC — Œ = AoÀ. 


De l'égalité 4,D = À,4, ïi.e. AD = 0 il découle que les points À 
et D coïncident (axiome V.) et, par conséquent, À € P. Ainsi, l’éga- 
lité (18.3) implique À € P. 

Théorème 18.3. Soient e;, ..., e, des vecteurs de l’espace 
R et A,ç un point de l’espace X. Alors l’ensemble P de tous les points de 
la forme (18.3), où À, ..., N sont des nombres réels, est un plan de 
dimension r au plus, le sous-espace directeur pour ce plan étant un sous- 
espace engendré par les vecteurs e,, . .., e,. Si les vecteurs e,,...,e. 
sont linéairement indépendants, alors dim P —r. 

Démonstration. Soit À;,, ..., À, un système de points 
appartenant à l’ensemble P, i.e. 


À; = A+ Mer + ...+LÂer, i — À, ….., S, (18.6) 
et soit À une combinaison de points À,, ..., À,, i.e. 
| A =ulA4, +... + u°4,, (18.7) 
où 
ui +... +u = 1. (18.8) 


La relation (18.7) signifie que 


— — — 
QA=N'OQA;+ ...+uQ4s 
pour tout point Q € X, et la relation (18.6) signifie que 


— — 
OA; = QAo+ ie + ...—+Âer, i= À, 3 Se 
Il s'ensuit (en vertu de (18.8)) 


7 À ST iNA 1 r 
QA — 2 U"(OA5+ Àies +... + Mer) = 


—> > nn. 
= QAo+(Z ne + + (ZX HA) er. 


10* 
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Cette relation est de la forme (18.3) et, par conséquent, 4 € P. 
Ainsi, on déduit de (18.7), (18.8) que À € P, i.e. P représente un 
plan. 

Désignons par Z le sous-espace directeur de ce plan. La rela- 
tion (18.3), que l’on peut mettre sous la forme (18.4), implique que 
tout vecteur de la forme Àle, + ... + \’e, appartient au sous- 

Se 


espace L,. Inversement, soit a € L», i.e. a — AB, où À, BE P. 
Alors, 


— — 
AA=hMe;+...+\er, AyB=vle;t...+ve,, 
et donc 


— — — | 
a = AB= A$B—AjA=(vt—-Ae +...+(v"—\)e,. 


Ainsi, le vecteur a appartient au sous-espace ZL, si, et seulement si, 
a est une combinaison linéaire des vecteurs e,, . ..,e,. Autrement 
dit, LP est le sous-espace engendré par les vecteurs e,, ..., e,(voir 
le théorème 14.6). 

Il en découle aussi l'inégalité dim P — dim Z}, < r dans le cas 
général et l'égalité dim P — dim L, — r dans le cas où les vecteurs 
€, . .- ., er Sont linéairement indépendants. 

Remarque 18.4. Les théorèmes 18.2 et 18.3 montrent que 
tout plan de dimension r peut être décrit par l’équation (18.3), dans 
laquelle e,, . .., e. sont des vecteurs linéairement indépendants et 
M, ..., N parcourent (indépendamment l’un de l’autre) toutes les 
valeurs réelles et, réciproquement, toute équation de cette forme décrit 
un certain plan de dimension r. 

L'équation (18.3) s'appelle équation vectorielle paramétrique du 
plan de dimension r. En particulier, pour r = 1, l'équation (18.8) 
s’écrira 

A = A, +2e; (18,9) 
c’est l'équation vectorielle paramétrique de la droite; ici e est un 
vecteur non nul (de l’espace À), À, un point quelconque de l’espace 
X et À parcourt toutes les valeurs réelles. Toute droite peut s’écrire 
sous la forme (18.9) et, inversement, toute équation de cette forme 
décrit une certaine droite. Le vecteur e s'appelle vecteur directeur 
de cette droite. 

Si P est un certain plan, L}, son sous-espace directeur et e,, ... 

., € Une base du sous-espace L,,, le système de vecteurs Enr +. 

., € est également appelé base du plan P. Ainsi, pour écrire 
l’ équation vectorielle du plan P (voir (18.3)), il faut connaître une 
base e,, . . .,e, de ce plan et un point À, appartenant à ce plan. 

Définition 18.5. Deux plans P, P' (situés dans un même 
espace affine X) s'appellent parallèles (notation: P | P) si leurs 
sous-espaces directeurs coïncident. 
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Cette définition peut être reformulée de la manière suivante: 
deux plans sont dits parallèles si la base de l’un d’entre eux est en 
même temps une base de l’autre. Remarquons que d’après cette 
définition deux plansqui coïncident sont considérés paral- 
lèles. Notons aussi que la définition implique que deux plans ne 
sont parallèles que s’ils ont 1 a m ê m e dimension, la relation de 
parallélisme (des plans de dimension r) jouissant des propriétés de 
réflexivité de symétrie et de transitivité. On emploie néanmoins quel- 
quefois une autre terminologie, selon laquelle une droite peut être 
parallèle à un plan et, plus généralement, des plans de dimension 
différente peuvent être parallèles entre eux. À savoir, deux plans 
P, Q sont considérés parallèles si pour leurs sous-espaces directeurs 
LP, LQ on a l'inclusion L}, = LQ (ou LE LA). Nous ne nous ser- 
virons pas de cette terminologie. 

Théorème 18.6. Par tout point B, € X il passe un seul plan 
parallèle au plan donné P € X. De plus, deux plans parallèles quel- 
conques soit coincident, soit n’ont aucun point commun. Ainsi, si un 
plan PE X est défini, tout l’espace X peut être rempli de plans dis- 
joints deux à deux et parallèles au plan P. 

Démonstration. Supposons que le plan donné P a l’équa- 
tion vectorielle paramétrique (18.3), i.e. À, € P, les vecteurs e,, . .. 

., € formant une base du plan P. Alors le plan décrit par l’équa- 
tion 

A=B,j+hMe + ...+\e, 


est parallèle au plan P et passe par le point B,, ce qui démontre la 
première asserlion du théorème. | 

Soient maintenant P,, P, deux plans parallèles qui possèdent le 
point commun C;. Choisissons une base quelconque e;,, . .., e, du 
plan P,. Les plans P,, P, étant parallèles, e,, . . ., e, est également 
une base du plan P,. Ainsi, les plans P,, P, ont un point commun 
C, et une base commune e,, ..., e,.. Par conséquent, ces deux plans 
sont décrits par une même équation vectorielle paramétrique 


À = C, + Me, +  … + \'e, 


et donc coïncident. 

Théorème 18.7. Soient P un plan de dimension r dans l’es- 
pace X et À, À, ..., À, un système de points libres de ce plan. Le 
point À € X appartient au plan P si, et seulement si, on peut trouver 
des nombres réels N°, À, ..., À" qui satisfont aux conditions 


NHAL LAN —=1, (18.10) 
A = NA +AA, + ... + NA. (18.11) 


Dans ce cas, les nombres N°, M, ..., N sont déterminés par le point 
A CP d'une manière unique. 
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Démonstration. Puisque les points À,, A,, ..., À, 
sont libres, les vecteurs 


——> —— 
ei = AA, ... Er = ApÀ7r 


sont linéairement indépendants. Tous ces vecteurs appartiennent au 
sous-espace directeur ZL? du plan P et forment donc une base du 
sous-espace LP et du plan P. Aïnsi, le point À € X appartient au 
plan P si, et seulement si, on peut l’écrire sous la forme 

A — À, + Me, + . … » + \’'e,, 


1.e. Si 
— ——> —— 
AoÀ = M'AoA1 +... +N' Aid. 


(Les nombres À, ..., À” sont alors déterminés de façon unique par 
le point À € P.) Choisissant maintenant un point Q € X, nous pou- 
vons récrire cette relation sous la forme 


QA—QA,= M (QA— QD +... LA (OA, — QAy), 
ou 


— — — — 
CAEN NOA SE NOAEL EN OA, 


et cette relation est équivalente aux relations (18.10), (18.11) (où 
NM—1—M— ... — 2. 

Corollaire 18.8. Soient P une certaine droite et À,, À; 
deux points distincts de cette droite. Le point À € X est un point de la 
droite P si, et seulement si, il existe un nombre réel À qui satisfait à la 
condition 


A = de) A LA 


On peut déduire de ce corollaire que par deux points quelconques 
distincts As, A, € X passe une droite et une seule. Nous l’appelle- 
rons « droite A,A,». Ensuite, il est évident que pour deux points 
quelconques A4, 4, € X le segment [4,, A,] (voir l’exemple 17.5) 
est entièrement contenu dans la droite À ,4:. 

Théorème 18.9. L'intersection de deux (ou d’un nombre quel- 
conque) de plans est un plan. 

Démonstration. Soient P, et P, deux plans et P — 
— P., fN\ P, leur intersection. Soient aussi 4,, ..., À, des points de 
l’ensemble P et Al, ..., À° des nombres réels satisfaisant à la con- 
dition 

M+ ... +=. (18.12) 
Comme 4,,..., A,E PE P, et P, est un plan, le point 


He PA Less AL (18.13) 
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appartient au plan P,. D'après des considérations analogues le 
point A appartient au plan P,. Par conséquent, À € P,fN P, = P. 
Ainsi, tout point de la forme (18.13), où À,, ..., A,€ P et les nom- 
bres À, ..., À° satisfont à la condition (18.12), appartient à l’en- 
semble P, et pour cette raison P est un plan. Des raisonnements 
analogues sont applicables à l’intersection d’un nombre de plans 
quelconque. 

Il découle du théorème 18.9 que, pour un ensemble O0 X, il 
existe dans X un plan PQ min i m a 1 contenant l’ensemble ©, ï.e. 
un plan PQ, contenant l’ensemble Q, implique P = P, (cf. la pa- 
se 112). On l'appelle plan engendré par l’ensemble ©. 

Théorème 18.10. Soient Q un ensemble de X et PQ le plan 
engendré par cet ensemble. Le point À € X appartient au plan P, si, 
et seulement si, on peut trouver des points À,, ..., A,€ Q et des 
nombres réels M, ..., À satisfaisant à la condition (18.12) tels que 
l’on ait l'égalité (18.13). 

Démonstration. Choisissons dans Q un nombre maximal 
de points libres, i.e. l’ensemble de r + 4 points B,, B,, ..., B,€ 
€ Q libres, tandis que chaque ensemble de r + 2 points de l’ensem- 
ble Q sont liés. Notons par P le plan de dimension r qui contient les 
points Bo, B,, ..., B,. D'après le théorème 18.7, le plan P con- 
siste en tous les points B de la forme 


B Fes NB, + MB, -|- … + NB,, (18.14) 
où À, M, ..., À sont des nombres réels, satisfaisant à la condition 
MEME  . .+N—=1. (18.15) 


Puisque le plan P, contient l’ensemble Q et, par conséquent, les 
points B5, B1, ..., B,, alors PQ contient tout point de la forme 
(18.14), où les nombres A, À, ..., À” satisfont à la condition 
(18.15), i.e. PQ P. 

Remarquons que les vecteurs 

———> 


——> 
Ci — B,B;, ., Er — BoBr (18.16) 


forment une base du plan P. Si maintenant B est un point arbitraire 
de l’ensemble ©, les points B,, B, B,, ..., B, sont liés, i.e. les 
vecteurs 

—— 


—>  —> 
B,B, B,B:, ..., BB, 
e e. er 
sont linéairement dépendants. Par conséquent, le vecteur B,B 


s'exprime linéairement en fonction des vecteurs (18.16) (ces derniers 
étant linéairement indépendants): 


she r 
BB=pute;+...+u'er, 
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1.e. 
B = B, + ue, + . + + u'e.. 


D'ici, en vertu du théorème 18.2, on déduit que BE P. Ainsi 
Qc P et donc P,LE P. 

D'après les inclusions démontrées P, = P, P, P, on a l’éga- 
lité PQ = P. Les relations (18.14), (18.15) impliquent donc que 
chaque point du plan P, se met sous la forme requise (voir (18.12), 
(18.13)). La réciproque est également évidente: si le point À s'écrit 
sous la forme (18.12), (18.13), où 4,, ..., A,€ Q et, par consé- 
quent, À,, ..., À, € Po, alors À € P:. 

Théorème 18.11. Soient P un plan de dimension r de l’es- 
pace affine X et O un point du plan P. Transformons X en espace vec- 
toriel de la manière indiquée au théorème 17.7. Alors P sera un sous- 
espace de dimension r de l’espace vectoriel obtenu. 

Démonstration. Soient À, BE P. Alors le point C — 
— À + B — O appartient à P (P étant un plan). Mais dans l’espace 
vectoriel considéré, le point C est la somme des points À et B: 


C = À + B. 


Ainsi, si A, B € P, alors À + B € P. On montre d’une façon analo- 
gue que À € P implique ÀA € P pour tout À réel. Par conséquent, P 
est un sous-espace. 

Théorème 18.12. Soient P, et P, deux plans de l’espace affine 
X possédant au moins un point commun et soient P —P,f) P, l'in- 
tersection de ces plans et P* le plan engendré par l'ensemble P, |} P;,. 
À lors, ; 


dim P* = dim P, + dim P, — dim ?. 


Démonstration. Choisissons un point quelconque O € P 
et transformons X en espace vectoriel, comme indiqué au théorème 
17.7. Alors P,, P,, P, P* seront des sous-espaces de cet espace vecto- 
riel X. La relation à démontrer découle immédiatement du théo- 
rème 414.9. 

Définition 18.13. Soit (R, X) un espace affine. Les plans 
P,Q< X s'appellent supplémentaires si leurs sous-espaces directeurs 
LP, LQ sont des supplémentaires directs l’un de l’autre, i. e. À — 
= Lp Œ Lo. 

[1 découle immédiatement de cette définition que si les plans P, 
et P, sont supplémentaires et si P;|| P4, P, |] Ps, alors les plans P; 
et P; sont également supplémentaires. Ensuite, d’après le théorème 
14.10, pour les plans supplémentaires P,, P, de l’espace X, on a la 
relation 

dim P, + dim P, = dim X. 


Théorème 18.14. Deux plans de l'espace affine supplémen- 
laires entre eux possèdent exactement un point commun. 
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Démonstration. Soient (R, X) un espace affine et P, Q 
deux plans supplémentaires de X. Les sous-espaces directeurs des 
plans P, Q seront notés L», LQ respectivement. Posons dim L} = p, 
dim Lo = q, dim À — n. Alors, p + q — n. Choisissons une base 
€, - .., eh du sous-espace ZL}, et une base e,:,,..., e, du sous- 
espace Lo; d'après la remarque se rapportant au théorème 14.10, Les 
VeCÉEUTS €, - - ., Eps Ep+ys + + + En forment une base de l’espace 
vectoriel À. 

Choisissons maintenant des points À € P, BE Q. Alors, en dé- 


—> 
composant le vecteur AB par rapport à la base e,, . ..,e,, nous 
obtenons 


= 
AB=ate;+...+ale,+aftle,,;;+...+a"e,. (18.17) 
Notons par C € X le point défini par l'égalité 


—— 
AC=ate;+...+ae,. (18.18) 
De (18.17) er (18.18) on obtient immédiatement: 


—> —>  — 
BC = AC— AB - œte jn—...— d'en. (18.19) 


Prenant en considération les inclusions À € P, BE Q et les rela- 
tions (18.18), (18.19) en vertu du théorème 18.2, nous trouvons que 
CE P,CEQ. Ainsi, les plans P et Q ont un point commun C. 


> 
Si D est un autre point commun de ces plans, alors CD € L», 
= 
CD € La et, par conséquent, d’après la relation À — L} @ Lo, nous 
— 


obtenons CD = 0, ïi.e. C — D. Le théorème est démontré. 

Pour conclure, introduisons la notion de demi-droite, dont nous 
nous servirons par la suite. Soient A,E€ X,e € R. Nous appellerons 
demi-droite d’origine À, et de vecteur directeur e l’ensemble de tous 
les points de la forme 


A=Aj+he, à >0. (18.20) 


Cette relation diffère de l'équation (18.9) par le fait qu'ici le para- 
mètre À ne prend plus toutes les valeurs réelles, mais seulement les 
valeurs non négatives. Ainsi, la demi-droite d’origine À, 
et de vecteur directeur e est entièrement contenue dans la droite qui 
passe par le point À, et possède pour vecteur directeur le vecteur e. 
Cette même droite contient également la demi-droite d’origine À, 
et de vecteur directeur —e ; elle s'appelle opposée à la demi-droite 
(18.20). II n’y a pas de troisième demi-droite d'extrémité À,, outre 
des deux demi-droites nommées, qui soit contenue dans la droite 
(18.9). Pour cette raison, les deux demi-droites sont appelées demi- 
droites définies par le point À, sur la droite (18.9). 
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Remarquons que si k est un nombre réel quelconque, alors la 
demi-droite (18.20) c o ï n c i de avec la demi-droite de même ori- 
gine À, et de vecteur directeur ke. Autrement dit, si Z est une demi- 
droite d’origine À, et si B est un point de cette demi-droite, diffé- 


—> 

rent de À,, alors le vecteur A,B est le vecteur directeur de la demi- 
droite Z; dans ce cas on dit également que / est la demi-droite d’ori- 
gine À, qui passe par le point B. Aïnsi, la demi-droite d’origine À, 


A 1-46 
EU 






Fig. 51 


qui passe par le point B est l’ensemble de tous les points À pour les- 


— — 
quels ÀA,4 = 14,B, où À > 0 (fig. 51). 

19. Applications affines. Soient (À, X}) et (S, Y) des espaces 
affines. L'application ®: X —Y s’appelle application affine (ou 
linéaire) si la relation 

A=(1—dDB+XC, 
où A, B,CE X, implique la relation 
p(4)=(1—2) p(B)+ A (0). 

Théorème 19.1. Soit ®: À —Ÿ une application affine. 

A lors la relation 


A =MA,+...+4\4A,, (19.1) 
où À, ÀA,,..., AE X et 
A +... += 1, (19.2) 


implique la relation 
p (4) = Àp (43) +... + À (Ai). (19.3) 

Démonstration. Raisonnons par récurrence sur s. Pour 
s — 2 la relation à démontrer est immédiate d’après la définition 
d’une application affine. 

Supposons que la relation à démontrer est établie dans tous les 
cas où le second membre contient moins de s termes, et supposons 
satisfaites les relations (19.1), (19.2) pour s > 8. Il est clair qu’au 
moins un des nombres À, ..., À est différent de l’unité (autre- 
ment la relation (19.2) ne pourrait avoir lieu). Supposons, pour fixer 
les idées, que À° 1, i.e. 1 — À° Æ 0. Considérons le point 


À! Às-i 
B=-——— A+ PACE +5 As: (19.4) 
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ici la somme des coefficients du second membre est égale à l’unité: 





A1 Met Mi... past ds 
ne ee es 
Par hypothèse de récurrence, on a la relation 
A1 . Às—1 
PB)=-— p (Ai) +... + 9 (As). (19.5) 


I1 découle de (19.1) et de (19.4) que 
A = ({— À B + X‘A,, 
et en vertu de la définition de l’application affine, on a donc 
p(A)= (1 — À) p(B) + Xp (À). (19.6) 


La relation (19.8) découle de (19.5) et (19.6). 

Corollaire 19.2. Soit o: À —Ÿ une application affine 
et supposons que @ (4;) = AŸ, o (B;) — BŸ, i — 1, ..., k (où À;, 
PB; € X). Alors il découle de la relation 


—— ——> 
c'A,B;+...+a*A,B,—0 (19.7) 
que 
— ———> 
QAFB* +... La AÏ BÉ — 0. (19.8) 


Démonstration. L'égalité (19.7) signifie que 
MB — A+... + ar (B, — A) = 0, 


Q=Q+aB, +... + atB, — alA, — ... — «A, 


(où Q est un point arbitraire de l’espace X). Par conséquent, d’après 
le théorème 19.1. 


Q*—Q*+aiBi+ ...LoBi —œtAf—...—afAX, 
(où Q* = @ (Q)), 1.6. 
ci (B— AŸ) +... + ah (Bi —Aï)—0, 


ce qui représente justement la relation (19.8). 

Théorème 19.3. Soient o: X —Ÿ une application afjine 
et PE X un plan. Alors son image ® (P) est un plan de l’espace Y, 
et l'on a dim  (P) < dim P. 

Démonstration. Soient B,, ..., B, des points de l’en- 
semble @ (P) et soient À!, ..., À° des nombres réels satisfaisant à 
la relation 


M+... +A=t. 
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Considérons le point 
B = MB, + ... + XSB, 
l’espace Y et démontrons que B € @ (P). Comme B; € œ (P), 
— 1, ...,s, on peut trouver un point À; € P tel que œ (4;) — 


— B;. De cette façon nous obtenons des points À,, ..., À, du 
plan P. Par conséquent, le point 


ANA DE... Eat 


appartient également au plan P. D’après le théorème 19.1, nous 
avons 


p(4)=pMAi+ ...+AAs)= Mo(4i)+...-+Ap (A) — 
ip. hp: 


Vu que À € P, on a B — (A) E @(P). Ainsi, p (P) est un plan. 

Si les points B,, ..., B, du plan  (P) sont libres, les points 
À, -.., À, satisfaisant aux conditions @ (4;) — B;, i — 1, .. 

., 8, le sont également. Il en découle justement |’ inégalité 
dim p (P) < dim P. 

On démontre d’une manière analogue le théorème suivant : 

Théorème 19.4. L'image réciproque @"! (P) d'un plan quel- 
conque PE Ÿ par une application affine ®: X — Ÿ est un plan de 
l’espace X. 

Théorème 19.5. Soient (R, X)et (S, Y) des espaces affines 
et p: X — Y une application affine. Il existe alors un homomorphisme 
(et un seul)»: R —$S qui jouit de la propriété suivante: la relation 


A—B+a(4A, BEX,a€R) (19.9) 
p (4) —  (B) + y (a). (19.10) 


Démonstration. Fixons dans l’espace X un point ©. Si 
maintenant & est un vecteur arbitraire de l’espace À, nous pouvons 


implique 


_— 
prendre un point À € X pour lequel OA — «a el poser 
—_————— 
p(a)=p(4)—®(0)=p(0)p(4)ES. (19.11) 


Ainsi, nous avons défini une application D: R —S. 
Montrons que Ÿ est un homomorphisme. Soient &, b € R. Choisis- 
sons les points 4, B, CE X tels que 


— — — 
OA—a, OB—b, OC—a+b. 


— — — 
Alors OC — OA — OB — 0 et pour cette raison, en vertu du corol- 
laire 19.2, 


@ (0) p (C) —p (0) v(4)— p(0)p(B)— 


$ 5] GÉOMÉTRIE EUCLIDIENNE 457 


i.e. 4 (@ + b) — vd (a) — 1 (db) — 0. Ainsi, 
b (a + 6) — (a) + Ÿ (b), (19.12) 


quels que soient les vecteurs «a, b € R. 
Ensuite, supposons que «a € R et À est un nombre réel. Choisis- 
sons des points À, D € X tels que 


— —> 
OA = a, OD = a. 
—— — 
Alors OD — XOA — 0 et donc, en vertu du corollaire 19.2, 


9 (0) 9 (D)— 19 (0) p(4)—0, 
i.e. 1 (AG) — Ab (a) — 0. Ainsi, 
d (A4) = À (a), (19.13) 


quels que soient a € R et le nombre réel À. Il s’ensuit des relations 
(19.12), (19.13) que est un homomorphisme. 
Si la relation (19.9) est vérifiée, nous avons d’après (19.11) 


q(B)—œp(4)=(p(B)—œ(0)) —(4)—œ(0)) — 
— p(0B)—p(04)=+p(O0B—0A)—Y(AB)—p(B—A)= — (a), 


i.e. l’homomorphisme construit 1 est bien celui que l’on cherche. 

L’unicité découle du fait que la relation (19.11) est la consé- 
quence des relations (19.9), (19.10) (plus exactement, des relations 
obtenues en supposant que le point B coïncide avec © dans les rela- 
tions (19.9), (19.10)). Par conséquent, chaque homomorphisme qui 
satisfait aux conditions données (voir (19.9), (19.10)) doit, en parti- 
culier, satisfaire à la relation (19.11), i.e. doit coïncider avec . 

Le théorème suivant est dans un certain sens la réciproque du 
précédent. 

Théorème 19.6. Soient (R, X) et (S, YŸ) des espaces affines 
et soient %: R —S un homomorphisme, O un point de l’espace X et 
O" un point de l’espace Y. Dans ce cas, l'application @: X —Y 
définie par la formule 


9 (4)=—0' ++ (0À) 


sera affine. 
Démonstration. Posons À = (1 —2X)B<+AC, où 
A, B, CE X. Alors 


— — — 
OA=(1—2)0B+A0C, 
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et par conséquent 
— — — 
p(4)=0"+1p(04)=0"+3%((1—2)0B+200)— 
= 0" + (1—2) (O8) + ap (OÙ) = (1— 2) (0° + (OË) + 


S 
+A(0"+%ÿ(00))=(1— 2) (B) +Aw(0). 
Théorème 19.7. Soit ®: X —Y une application affine. 
Choisissons un point O € X et désignons par O" le point œ (O0) de l’es- 
pace Ÿ. Fixant le point O, transformons X en espace vectoriel et, fixant 
le point 0", transformons Y en espace vectoriel. Alors l'application 
sera un homomorphisme de l’espace vectoriel X dans l’espace vectoriel Y. 
Démonstration. Soient À, BE X; considérons le point 
C = À + B — O. Alors C est la somme des points À et B dans 
l’espace vectoriel X. On déduit de la relation C = A+ B—Oet 
du fait que l’application œ est affine que  (C) — @ (A) + œ (B) — 
— p (0) = p (4) + p(B) — O0", ce qui veut dire que le point 
@ (C) est, dans l’espace vectoriel Ÿ, la somme des points œ (4) et 
p (B). Aïnsi, l’application p: À — Ÿ respecte l’addition. On dé- 
montre d’une manière analogue la relation @ (44) — Àçp (4). 
Remarquons que le théorème 19.7 permet d’obtenir de nouvelles 
démonstrations des théorèmes 19.3 et 19.4. La démonstration du 
théorème suivant, la réciproque du théorème 19.7, est immédiate. 
Théorème 19.8. Soient X, Y des espaces affines et @: X —Y 
une application. Choisissons un point O € X et posons O0" = (0). 
Comme dans le théorème précédent, transformons X et Ÿ en espaces 
vectoriels en fixant les points O et O”. Si o@ est un homomorphisme d’es- 
paces vectoriels, alors @ est une application affine de l’espace X dans 


l’espace Y. 

Théorème 19.9. Soient X et YŸ des espaces affines. Suppo- 
sons que dim À = n et que À,, A1, . .., À, est un système de points 
libres dans X. Alors, pour des points quelconques B,, B;,, ..., B, 


de l’espace Ÿ, il existe une application affine d’une seule oq: X —Y 
qui satisfait à la condition 


P (A6) = Bo, p (A1) = Ba, +. ., p (An) = Br. (19.14) 
Démonstration. Soit À un point de l’espace X. Alors, 

en vertu du théorème 18.7 (pour le cas P — X),on a 
A = MA, +MA, +... + \4,, (19.15) 
où A0, À, ..., À" sont des nombres réels qui satisfont à la relation 

AA ES EE EE CE © 
Dans ce cas, les nombres 4°, Àl, ..., À” se déterminent de manière 
unique par le point À. Posons 


(4) = NB, + MB, +... + NB. (19.16) 
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Nous obtenons ainsi une application @: À —Ÿ qui satisfait évi- 
demment à la relation (19.14). 

Fixons maintenant dans X le point O — À,, et dans YŸ le point 
O' = p(4,) — B9, transformant ainsi X et Ÿ en espaces vectoriels. 
En vertu des opérations définies dans ces espaces vectoriels, les rela- 
tions (19.15), (19.16) se mettent sous la forme 


ANAL ENA. 
p(4)= hp (41) +... +" (4). 


Il en découle que œ est un homomorphisme des espaces vectoriels 
considérés, et par conséquent, d’après le théorème 19.8, est une 
application affine. 

L'unicité découle du fait que pour toute application affine 
p: X —Y les relations (19.14), (19.15) impliquent (19.16). 

Définition 19.10. Soient (À, X) un espace affine et P, Q 
deux plans supplémentaires entre eux dans X. Par un point AE X 
construisons le plan Q” parallèle au plan Q (théorème 18.6). Alors, P 
et Q” sont également supplémentaires entre eux dans X, et possè- 
dent donc un point commun unique (théorème 18.14). Désignons ce 
point commun par x (4). Nous avons donc obtenu une application 
mx: X —X. On l'appelle projection de l’espace X sur le plan P 
parallèlement au plan Q (cf. la définition 15.6). 

Théorème 19.11. Soient (R, X) un espace affine et P, Q deux 
plans supplémentaires dans X. Alors la projection de l’espace X sur le 
plan P parallèlement au plan Q est une application affine. 

Démonstration. Soit © le point commun des plans P 
et Q (théorème 18.14). Transformons X en espace vectoriel en fixant 
le point O. Alors P et © seront des sous-espaces de cet espace (théo- 
rème 18.11). Puisque l’intersection P f] Q ne contient que le point 
O (elle est donc le sous-espace trivial) et dim P + dim Q — dim X, 
on a À — P @ Q (théorème 14.10). 

Par conséquent, nous pouvons considérer la projection de l’espa- 
ce vectoriel X sur le sous-espace P parallèlement au sous-espace Q 
(voir le théorème 15.7). Désignons cette projection par x*. D’après le 
théorème 15.7, l'application x* de l’espace vectoriel X en lui-même 
est un homomorphisme. Il est évident que n* (0) = O. En vertu du 
théorème 19.8, l’application x* de l’espace affine X dans X est af- 
fine. Par conséquent, pour conclure la démonstration il suffit d’éta- 
blir que les applications x et x* coïncident. 

Soient À un point de l’espace X et B = n (4). Alors B est un 
point commun des plans P et Q”, où Q” est le plan parallèle à Q et 


és 
passant par le point À. Vu que À € Q'et BE Q',on a BA € Lor, où 
Lo est le sous-espace directeur du plan‘Q” (et donc du plan Q). Soit 


— — 
C'un point tel que OC — BA. Alors, d’après le théorème 18.2, C € Q. 
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—> —> 
L'égalité OC — BA signifie que 
+ 
A—B+OC, ie. A—B+C—O, 


et nous avons donc, dans l’espace vectoriel X, la relation À — B + 
+ C (voir le théorème 17.7). Des relations 4 = B+C, BE P, 
C EQ, vérifiées dans l’espace vectoriel X, on déduit maintenant que 
B = n* (4) (voir la définition 15.6). Aïnsi, n* (A) — x (A) pour 
tout point À € X, i.e. les applications x et x* coïncident. 

Théorème 19.12. Soient (R, X) un espace affine et P, Q deux 
plans supplémentaires entre eux dans X. Désignons par x la projection 
de l’espace X sur le plan P parallèlement à Q. Alors, pour tout plan 
NC P, l’image inverse x7"(N) est un plan de X de dimension 
dim © + dim N. En particulier, si N est un hyperplan de l’espace affine 
P, alors x? (N) est un hyperplan de l'espace X. 

Démonstration. Le fait que x"! (N) est un plan décou- 
le immédiatement des théorèmes 19.11 et 19.4. D'autre part, on peut 
noter par © le point commun des plans P et Q et transformer X en 
espace vectoriel en fixant O. Alors x sera la projection de l’espace 
vectoriel X sur le sous-espace P parallèlement au sous-espace Q (voir 
la démonstration du théorème 19.11) et, par conséquent, d’après le 
théorème 15.7, on a Ker x — Q, Im x = P. 

Désignons par x, l'application x considérée sur le sous-espace 
n'l(N), i.e. x, est la projection de l’espace x 7!'(N) sur N parallè- 
lement au sous-espace Q. Alors, Im x, = N, Ker x, — Ker x — Q 
et du théorème 15.3 il découle que 


dim x! (W)= dim (Im x) + dim (Ker x;) — dim Q + dim N. 


Si, en particulier, V est un hyperplan de l’espace affine P, i.e. 
dim V — dim P — 1, alors 


dim n7t(N)= dim N + dim Q— (dim P — 1) + dimQ— dim X —1, 


i.e. x !(N) est un hyperplan de l’espace X. 

Théorème 19.13. Soient P, et P, deux plans parallèles de 
dimension k de l’espace X. Il existe alors dans X un plan P de dimen- 
sion k + À qui contient P, et P, (ce plan est unique si P, Æ P;). 

Démonstration. Soit Q un plan complémentaire direct 
du plan P,. Désignons par x la projection de l’espace X sur le plan 
Q parallèlement au plan P,. D’après la définition de la projection, 
le point x (P,) — À, est un seul point du plan Q et x (P,) — 
— À, est aussi un seul point du plan Q. Considérons la droi- 
te N qui passe par les points 4, et 4,. Alors NE Q et, donc, 
d’après le théorème 19.12, l’ensemble x°7! (N) est un plan de X de 
dimension 


dima t(N)=dimN+dimP,=1+k. 
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Il est également clair que x -1(N)> P, et x-!(N) = P,. Ainsi, le 
plan x71(N) est le plan cherché. 

Si P, = P;, l’ensemble P, {|} P, n’est contenu dans aucun plan 
de dimension k, i.e. le plan P engendré par l’ensemble P, [|] P, 
est de dimension égale au moins à Æ + 1 (et qui ne peut dépasser 
k + 1 d’après ce que l’on vient de démontrer). Ainsi, dim P — 
— k + À et chaque plan de dimension k# + À qui contient P, |} P, 
contient donc le plan P de dimension k + 1, avec lequel il doit 
donc coïncider. 


Exemple 19.14. Soient (R, X) un espace affine, O € X un 
point et v un nombre réel. Posons 


f(4)=0+v0A, A6X. 


Nous obtenons ainsi une application f de l’espace X dans X. On 
l'appelle homothétie de centre © et de coefficient v. Puisque l’appli- 
cation p: R—+R, définie par l’équation (a) — va, est évidem- 
ment un homomorphisme, alors, selon le théorème 19.6, l’homothé- 
tie est une application affine de l’espace X dans X. 
L’homothétie de centre © et de coefficient v — —1 s’appelle 
symétrie par rapport au point O. Cette symétrie transforme le point 


— — ns 
A € X en un point À’ tel que 4’ — O — OA, i.e. OA" — —OA. 
Cela signifie que O est le milieu du segment [A, A']. 

S'i Le coefficient d’une homothétie n'est pas nul, chaque plan PE X 


passe par cette homothétie à un plan parallèle à ce dernier. En effet, 


soient A,EPete,, ..., e, une base du plan P. Alors, chaque point 
A € P prend la forme 


À — A, + Me, + . + Ahe,, 
et donc 
— — 
OA=OA,+he;+...+iez. 


Par conséquent, 


f(4)=0 + v0Â = 0 +v(04-+ Mes … He) == 


=0O+v04+v(Me+ ...+Ae,) — 
= f (45) + v(Mei +... + Nez). 


On voit donc que lorsque le point À parcourt le plan P (i.e. les 
nombres réels À!, ..., À" prennent indépendamment l’un de l’autre 
toutes les valeurs réelles possibles), le point f (A) parcourt un plan 
qui passe par le point f (A) et possède la m ê me base e,, ..., ex. 
Ainsi, f (P) est un plan qui passe par le point f (4,) parallèlement à P. 
11—01208 
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20. Fonctions. affines. Soit (R, X) un espace affine. On appelle 
jonction affine (ou linéaire) sur l’espace X l'application affine f: X — 
— D, où D est l’ensemble de tous les nombres réels (munis d’une 
structure d'espace affine; voir la remarque 17.9). Autrement dit, la 
fonction f (à valeurs réelles), définie sur X, s'appelle fonction affine 
si de la relation 

A—=(1—À) B+X2C, 
vérifiée dans X, découle l'égalité 
f (4) = (1 — À) j (B) + Af (C). 
D'après le théorème 19.1 et des relations (vérifiées dans X) 
A=MA, +... +4A,, MH... HA = 1, 
on a pour la fonction affine f: X — D l'égalité 


f (4) = Mf (A5) +... + f (4). 


Ensuite, d’après le théorème 19.5, on a pour la fonction affine 
f: À =D la relation suivante 


f(B)=f(4)+p (4), A, BEX, (20.1) 


où p: À —D est un homomorphisme, i.e. une forme linéaire (dé- 
finie d’une manière unique par la fonction affine f). Du théorème 
19.6 on a réciproquement que si l’application f: X —D satisfait à la 
condition (20.1), où o est une forme linéaire sur À, alors f est une 
fonction affine. Bien plus, si l’application f: X — D satisfait à la 
condition 


f(B)=1+p(Q0È), BEX, (20.2) 


où © est un point fixe de cet espace X, À un nombre réel et æ: R —D 
une forme linéaire, alors, d’après le théorème 19.6, f est une fonc- 
tion affine. 

Si la forme œ (voir (20.1)) envoie tout l’espace R dans l'élément 
nul, i.e. @ (a) = 0 pour tout vecteur & € R, alors f (A) = f (B) pour 
deux points quelconques À, B € X, ï.e. la fonction affine f est cons- 
tante sur tout l’espace X. Mais si la forme n'est pas nulle, 
i.e. il existe un vecteur «a € R pour lequel (a) 0, alors la fonc- 
tion f n’est pas constante. Dans ce cas, pour tout nombre À € D, on 
peut trouver dans X un point B tel que f (B) = À. En effet, en po- 
sant B — À + xa, nous obtenons 


f (B) = f (4) + x (a); 


par conséquent, en choisissant un point arbitraire À € X et en dé- 
terminant le nombre x de l’équation 


f (4) + xp (a) = À 
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(cette équation a une solution, car o (a) 0), nous trouvons le 
point B pour lequel f (B) = À. Aïnsi, si la fonction affine f: À —+D 
n’est pas constante, elle prend sur X toutes les valeurs réelles. 

Notons aussi que si f: À — D est une fonction affine, alors, pour 
tout nombre À E D, la fonction f,: X —D, définie par l'égalité 
f1 (4) = f (A) + À, est également une fonction affine à laquelle 
correspond la même forme linéaire : À — D que pour la fonction 
f (ce qui est une conséquence immédiate de (20.1)). 

Théorème 20.1. Soit f: X D une fonction ajfjine non 
constante. Alors, l’ensemble de tous les points À € X, satisfaisant à la 
condition f (A) — 0 (cet ensemble s'appelle noyau de la fonction j 
et sera désigné par le symbole Ker f), est un hyperplan de l’espace X. 

Démonstration. D'après le théorème 19.4, l’ensemble 
Ker f — f-1 (0) est un plan dans X (puisque 0 est un plan de di- 
mension nulle dans D). Pour calculer la dimension de ce plan, choi- 
sissons dans X un point © tel que f (0) — 0 (un tel point existe 
puisque, par hypothèse, la fonction f n’est pas constante) et, en 
fixant le point O, transformons X en espace vectoriel (voir le théo- 
rème 17.7). Alors, en vertu du théorème 19.7, l'application f: X —- 
— D sera un homomorphisme, et le noyau Ker f de l’application 
affine f sera le noyau de cet homomorphisme, tandis que l’image 
Im f de l’homomorphisme f sera toute la droite RÀ (puisque la fonc- 
tion f n’est pas constante), i.e. dim (Im f) — 1. Nous obtenons main- 
tenant du théorème 15.3: 


dim (Ker f) — dim X — dim (Im jf) — dim X — 1, 
et, par conséquent, Ker f est un hyperplan de l’espace affine X. 


Théorème 20.2. Pour chaque hyperplan T de l’espace affine 
(R, X) il existe une fonction affine non constante f: À —D telle 


que T = Ker f. 
Démonstration. Soit dim X — n et donc dim L — n — 
— 1. Choisissons dans T' un système de n points libres 4,, À,, ... 


... An et soit À, un point (de l’espace X) qui n'appartient pas à 
l’hyperplan T. Alors, les points 4,, À,, ..., 4,1, À, sont libres. 
En vertu du théorème 19.9, il existe une fonction affine (et une seule} 
f: X —D, qui satisfait aux conditions 


f(4=f(4)=...=f(4n)=0, f(4n)=1. 


Il est évident que la fonction f n’est pas constante. Le noyau 
Ker f de cette fonction affine contient tous les points A,, À,, . .. 
... An-1 et, par conséquent, contient le plan engendré par ces 
points, i.e. Ker f= l. Maïs si le plan Kerf contenait un point 
BéT', il contiendrait n + À points libres 4,, À,, ..., An, BP, 
ce qui est impossible, étant donné que dim (Ker f) — n — 1. Aïnsi, 
Ker f ne contient pas de points n’appartenant pas à l’hyperplan |’, 
i.e. Ker f = F. 


11% 
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Théorème 20.3. Soient f,, f:: X — D deux fonctions affines 
qui ne diffèrent que d'une constante. Alors les hyperplans Ker f,, 
Ker f, sont parallèles. 

Démonstration. Puisque les fonctions f,, f, ne diffèrent 
que d’une constante, il leur correspond la même forme linéaire 
op: R —D (voir p. 163): 


fi(B)=f(4)+9(4B), f(B)=f2(4) +9 (AB). 


Par conséquent, les sous-espaces directeurs des noyaux Ker f,, 
Ker f, de ces fonctions affines coïncident (à savoir, ils coïncident 
avec le noyau Ker œ de la forme linéaire œ). Mais cela signifie juste- 
ment que les hyperplans Ker f,, Ker f, sont parallèles. 

Théorème 20.4. Soient f1, ..., f. des fonctions affines non 
._ constantes, définies sur un espace affine (R, X) de dimension n et soient 
l,, ..., l, Les noyaux de ces fonctions affines et ®,, . . ., 4 les for- 
mes linéaires correspondantes, définies sur l'espace vectoriel R : 


fi(B)=fi(4) + (AB), i=1,.., &. 


SÈ y, - +, Pr, Considérés comme des vecteurs de l'espace dual R*, 
sont linéairement indépendants, l'intersection V,f{N .../f\ TL, des 
hyperplans TV, ..., l, est un plan de dimension (n — k) dans X. 
Tout plan de dimension n — k peut être représenté sous cette forme. 

Démonstration. Complétons les vecteurs ®,, ..., @x 
de manière à obtenir une base ®,, . .., @zx, Dr+1, + « ., D, de l’es- 
pace R*. Choisissons ensuite dans l’espace À une base e,, ..., e, 
telle que (voir le théorème 15.12) 


0 pour i£ j, 
Pi y ={ 


À pour i — j. 
Choisissons un point À € X et posons 


M — —f; (A), #3 p} dE — fr (4), 
Ao=A+hMe + ... + Me. 


Nous avons alors (pour i = 1, ..., k): 


fa (4o) = fi (A) + pi (Mes +... +Ae,) — 
= f; (4) + Mi (es) +... + op (ex) = f: (4) += 0. 


Ainsi, le point À, appartient à l’hyperplan Ker f; pour i = 1,...,k, 
1.e. À, ernn .N Fr. 

Soit maintenant B un point de l’espace X. Mettons ce point sous 
la forme 


B = Ay+z'e +... +z'e,. 
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Pour tout i — À, ..., k nous avons 
fi (B) = fi (4o) + pi (t'es + ... + re) he (20.3) 
Si le point B appartient à l’intersection T, NN . N l,i.e. f; (B) — 
— 0 pour i — 14, ..., k, il s'ensuit que 2° on RS PRE 
i.e. le point PB est de la forme 
B — A+ rte, + …. + re. (20.4) 


Réciproquement, si le point B est de la forme (20.4), on déduit de 
(20.3) que j; (B) — 0 pour i = 1, ..., k,i.e. BET, N ...Nl:. 
Ainsi, F, AN ... fl T4 est l’ensemble de tous les points de la forme 
(20.4), ce qui veut dire que cet ensemble représente un plan de di- 
mension 2 — k passant par le point À, et ayant pour sous-espace 
directeur le sous-espace de dimension nr — k, engendré dans À par les 
VeCteUrS Ep, + + «+» En 

Démontrons la dernière assertion du théorème. Soit P un plan 
de dimension nr — k dans X. Choisissons une base ez+1, . .., e, du 
plan P et complétons cette base par les vecteurs e,,..., e, de ma- 
nière à obtenir une base e,, . . ., e, de l’espace À. Choisissons ensui- 
te un point À, du plan P. Définissons maintenant les formes linéaires 
Pis + - +, Pr Sur À en posant pour tout vecteur x = xle, + .. 


. +z'e, CR: 
ps; (x) = 2!, RE RE 


Enfin, définissons les fonctions affines f,, . .., f, sur X en posant 
ne | 
fi(4)=@; (404), i=1,..., k. 


Si 
A = A, +zlte +... +z'e, 


est un point de l’espace X, alors 


n 
A,A=xte;+...+zr'e, 
et, par conséquent, 


fi(A)=®; (AA)— p; (ze +... Lar'e,)=1!, im, ..., #4. 
Ainsi, le système 
1 (4) = 0, ..., fr (4) = 0 
est équivalent au fait que le point À est de la forme 
A = A+ 2" "ep + ... +z'en, 
i.e. il appartient au plan P. Autrement dit, 
P = (Ker j;) N ... N (Kerfz). 
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Définition 20.5. Soient Il un hyperplan de l’espace affine 
{R, X) et. À, B deux points de l’espace X qui n’appartiennent pas 
à l’hyperplan T'. Si le segment [A, B] ne coupe pas (n’a pas de point 
commun avec) l’hyperplan l', alors les points À, B seront dits situés 
d'un même côté de l’hyperplan l'. Si le sement [4, B] coupe l’hyper- 
plan l', alors les points 4, B sont dits situés des côtés opposés de l’hy- 
perplan Le 

Théorème 20.6. Soient l'un ipetar dans l’espace affine 
(R, X) et f une fonction affine sur X, dont le noyau est l’hyperplan T. 
Soient, d'autre part, À, B deux points de l'espace X qui n'appartiennent 
pas à l'hyperplan 183 Si les nombres f (À), f (B) sont de même signe, alors 
les points À, B sont situés du même côté de T', et si ces nombres sont de 
signe contraire, les points A, B sont situés de part et d'autre de T. 

Démonstration. Soit C un point du segment [4, B|, 
ie. C—(1—À) A + AB, où 0O<LA1<L1. Puisque l'application 
f est affine, nous avons 


f(C) = (1 — À) j (4) + Àf (B). (20.5) 
Si les deux nombres jf (4), f (B) sont de même signe, alors, vu que 
120,1 —72X>0 (les deux nombres À, 1 — À ne pouvant s’annuler 
en même temps), le nombre f (C) a le même signe et ne peut donc 
s'’annuler. Ainsi, f (C) 20 pour tout point C E [A, B], i.e. le seg- 
ment [A, Bln'’a pas de points communs avec l’hyperplan T = Ker f. 
Supposons maintenant que les nombres f (4) et f (B) sont de si- 
gne contraire. Posons 
1 }(4) f (4) _ | f (4)1 
f4)—fB)  fA4+(—/B) 1f41+|f@1" 
11 est clair que 0 << À* <Aet le point C* — (1 — À*) À + À*B 
appartient donc au segment [A, BI. On déduit immédiatement de 
(20.5) que f (C*) — 0, i.e. C* ET. Ainsi, dans ce cas le segment 
4, B1 possède un point (unique) commun C* avec l'hyperplan T. 
Théorème 20.7. Soit © un hyperplan dans l’espace affine 
(R, X). Alors, tous les points de l’espace X qui n'appartiennent pas à 
l'hyperplan TV peuvent être divisés (de manière unique) en deux ensem- 
dles disjoints IT,, IT, qui jouissent des propriétés suivantes : si les points 
A, BP appartiennent à l'un d'eux, ils sont situés d'un même côté de l’hy- 
perplan L''et si les points À, B appartiennent à des ensembles diffé- 
rents, ils sont situés de part et d’ autre de T'. 
Démonstration. Choisissons une fonction affine f: X —- 
— D, dont le noyau est l’hyperplan F et notons II, l’ensemble de 
tous les points À € X qui satisfont à la condition f (4) > 0, et II, 
l'ensemble de tous les points À € X qui satisfont à la condition 
f (A) < 0. Il est clair que tout point À qui n'appartient pas à l’hy- 
perplan [appartient à un seul des ensembles II,, Il,. Il découle di- 
rectement du théorème 20.6 que les ensembles II,, Il, jouissent des 
propriétés indiquées au théorème 20.7. 
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I1 nous reste à démontrer l’unicité de cette décomposition. Soient 
IT;, Il, deux autres ensembles aux mêmes propriétés. Il est clair que 
l’ensemble Il; est entièrement contenu dans l’un des ensembles 
IT,, Il, (autrement, on pourrait trouver deux points de Il, situés 
sur les côtés opposés relativement à l). Pour fixer les idées, supposons 
que IT; GII,. Exactement de la même manière, on peut montrer que 
l’ensemble IL est entièrement contenu dans l’un des ensembles IT;, 
IT,. Si l’on avait l'inclusion IL € Il, les points des différents 
ensembles Il;, IL, se trouveraient dans IT;, i.e. du même côté de f, 
ce qui est impossible. Par conséquent, IL € II,. Puisque IL, U IL: — 
= II U IL, des inclusions IE Il,, ILE I, nous déduisons que 
IT, = ]],, IT, — I]... 

Définition 20.8. Les ensembles II, II, construits dans 
le théorème 20.7 s'appellent demi-espaces ouverts déterminés dans 
X par l’hyperplan I (ou demi-espaces ouverts dans lesquels l’hyper- 
plan l' décompose l’espace X). Aïnsi, 


ILNIL= SZ, LN{T=G, IL NT= GG, ILUILUT=X. 


Chacun des ensembles IE, — IL U l, Il, = Il, U T s’appelle demi- 
espace fermé. Ainsi, 


IL NIL= 7”, IL UIL = X. 

Parfois, en prenant en considération la liaison qui existe entre 
les demi-espaces et les fonctions affines, on introduit également les 
termes de demi-espaces « positif » et «négatif». À savoir, soit ÿ : À—- 
—+ D une fonction affine non constante dont le noyau est l’hyperplan 
T' et supposons que les notations II,, Il, ont le même sens que dans 
la démonstration du théorème 20.7 (ï.e . dans les points de l’ensem- 
ble II, la fonction jf est positive, et dans les points de l’ensemble II, 
elle est négative). Alors II, s’appelle demi-espace ouvert positif et 
Il, demi-espace ouvert négatif. De la même manière on appelle Il, 
demi-espace fermé positif et Il, demi-espace fermé négatif. 

Mais il ne faut pas oublier que cette terminologie est convention- 
nelle. En effet, la fonction affine ÿ, — —ÿf a le même noyau (l’hyper- 
plan 1, mais pour cette fonction affine c’est maintenant IT, qui est 
le sous-espace positif et IT, le sous-espace négatif. Aïnsi, relative- 
ment à l’hyperplan [', les deux demi-espaces jouissent des mêmes 
droits et n'importe lequel d’entre eux peut être considéré comme 
« positif» (en choisissant d’une manière appropriée une fonction 
aîfine dont le noyau est l’hyperplan T\. 

Théorème 20.9. Soient T un hyperplan de l’espace X et À, 

——> 


BE X des points tels que le vecteur AB appartient au sous-espace 
directeur de l’hyperplan T (dans ce cas également on dit que le vecteur 


— 
AB est parallèle à l'hyperplan [). Alors, ou bien les deux points À, B 
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appartiennent à l'hyperplan T', ou bien ils sont situés d’un même 
côté de ce dernier. 


Démonstration. Soient C un point de l’hyperplan F et 


— — — 
D € X un point tel que CD — AB. Alors, D ET (le vecteur AB 
appartenant au sous-espace directeur de l’hyperplan [). Choisissons 


une fonction affine f dont le noyau est l’hyperplan l'. Alors, f (C) — 
— f (D) = 0. 


L — — 
La relation CD — AB peut s'écrire sous la forme 


——> 
D=C+AB=C+B— A; 
cette relation entraîne 


f(D) = f(C) + f((B) — f (4), 


i.e. f (B) — f (A). Il nous reste à appliquer le théorème 20.6. 

Théorème 20.10. Soient (R, X) un espace affine et P, Q 
deux plans supplémentaires dans X. Désignons par x la projection 
de l’espace X sur le plan P parallèlement au plan Q. Alors si II est 
le demi-espace ouvert (fermé) de l’espace P, l'image inverse x -! (Il) est 
un demi-espace ouvert (fermé) de l’espace X. 

Démonstration. Soit T l’hyperplan de l’espace P qui 
délimite le demi-espace II. Alors, en vertu du théorème 19.12, 
x”! (l)est un hyperlan de l’espace X. Soient 4, B des points du plan 
P qui n’appartiennent pas à l', et 4’, B' des points de l’espace X, 
tels que x (41) — 4, x (B') — B. Nous avons alors (l'application x 
étant affine) x ([A’', B'h) = [4, BI. 

Si les points 4, B du plan P sont situés du même côté de l’hyper- 
plan [', i.e. le segment [4, B] n’a pas de points communs avec F, 
alors le segment [4”’, B’] ne coupe pas x-1 (l'), i.e. les points 4’, B’ 
sont situés dans X du même côté de l’hyperplan x -1 (T). Si les points 
A, BP sont situés dans P de part et d’autre de l', alors A’, B” se si- 
tuent dans X de part et d'autre de l’hyperplan x-!(T), ce qui dé- 
montre notre assertion. 

21. Espace euclidien. L'espace affine (R, X) s'appelle espace 
euclidien, si R est muni d’un produit scalaire, i.e. À est un espace 
vectoriel euclidien. Ainsi, le couple (R, X) est un espace euclidien 
de dimension n si les vecteurs (les éléments de l’ensemble À) et les 
points (les éléments de l’ensemble X) satisfont à tous les cinq grou- 
pes d’axiomes. 

Cela permet d'introduire dans l’ensemble X des notions métriques 
(distances, mesure des angles, etc.). À savoir, soient À, B deux points 
de l’espace X. On appelle distance entre les points À et B la longueur 

PR" 


du vecteur AB ; on désigne la distance à l’aide d’un des symboles 
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p (4, B)ou | À — B |: 
as 


Soient maintenant À, B, C trois DORE 0 de l’espace X, avec BA, 


B = C. Dans ce cas, les vecteurs BA, BC ne sont pas nuls. L’angle 
entre les deux vecteurs (voir la remarque 16.6) est désigné par le 


MS 
symbole ABC. Remarquons que d’après notre définition de l'angle, 
on à toujours l'inégalité 


PS 
0 ABC<E nr. 
Enfin, si Z, et !, sont deux demi-droites de même origine B, on entend 


M 
par angle (,, L,) entre ces deux demi-droites l’angle entre les vecteurs 


NN 
directeurs des demi-droites /,, L,, i.e. l’angle ABC, où A €l,, CE 
et AB, C-ZÆB (fig. 92). 

Nous n’aurons pas besoin d’au- 
tres notions métriques (longueur 
d’arcs, aire des figures, volumes, 
etc.). 

Théorème 21.2. Tout espa- 
ce euclidien est un espace métrique, 
i.e. la notion de distance introduite Fig. 52 
dans l'espace euclidien jouit des 
trois propriétés suivantes (pour des points quelconques À, B, C): 

1” p (4, 4)=0; p(4, B)>0 pour A ÆB; 

2 p(4, B)=p(B8, 4); 

3 p(4, B)+p(B, C)>p (4, C). 

Démonstration. La relation p (4, À) — 0 signifie que 





= 

| AA | = 0, i.e. la longueur du vecteur nul est nulle (voir p. 128). 

L'inégalité p (4, B) > 0 pour 4 = B signifie que | «a | > 0 pour 
Re 

a = AB =£ 0 (voir l’axiome IV,). Ainsi, la propriété 1° est vérifiée. 

D'autre part, la relation p (4, B) — p(B, À) veut dire que 


— — 
| AB | = | BA |, i.e. (—a)? = a”; cette relation est également satis- 
faite. 
ru 2 RéBAte o (4, B)+po(B, C) > P (4; (a signifie que 
— — 
| AB | + | BC [> [AC I. Vu que AC — AB + BC, l'inégalité 


à démontrer peut s’écrire comme suit : 


— — —  — 
|AB|+1BC[>]BA + BC. 
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Cette relation est immédiate d’après le théorème 16.5 (voir la rela- 
tion (16.3)). 

Théorème 21.2. Quels que soient les points À, B, C de l’es- 
pace euclidien, on a (pour B:£ À, B = C) la relation 


NS 
(p (4, CP =(p(4, B)Ÿ + (p(B, C)}—2p (4, B)p(B, C) cos re 
(21.1) 


IN 
En particulier, si l'angle ABC est droit, alors 
(p (4, C)F = (bp (4, B)}Ÿ° + (p (B, C)}. (21.2) 


| — — 
Démonstration. Posons BA = a, BC = ce. Alors 


— —> — 
AC=—BC—-BA-=c—-a 
et par conséquent 


(p(4, C2=] AC P—(ACY = (c— a)= a?-+ 0? —2ae = 


La 
—|alP+|cep—2]|a||celcos(a, €) = 
DA ra ee 2 
—|BAP+]BC[—-2|BA|.|BC|cos (ABC) — 
LS 
—(0(4, B)ÿ+{(p(B, C) —20 (4, B)p(B, C)cos (ABC). 


Remarque 21.3. Le théorème 21.2, ainsi que certaines propositions 
établies plus haut, nous montrent que l’espace euclidien de dimension deux 
ossède les mêmes propriétés que le plan étudié dans le cours de géométrie plane 
à l’école, et l’espace euclidien de dimension trois coïncide selon ses propriétés 
avec l’espace étudié dans le cours de géométrie dans l’espace. 

Ainsi, nous avons établi à la page 150 qu’une droite et une seule passe par 
deux points distincts, à la page 148 que par chaque point il passe une seule droite 
parallèle à une droite donnée, et que deux droites parallèles à une troisième droi- 
te sont parallèles entre elles (transitivité du parallélisme), etc. Ensuite, si l’on 
écrit à la place de p (4, B) le symbole AB, consacré par la tradition scolaire 
pour désigner la longueur du segment aux extrémités À et B, alors la relation 3° 
du théorème 21.1 devient l’assertion bien connue que chaque côté d’un triangle 
est inférieure à la somme des deux autres côtés, et les relations (21.1), (21.2) 
deviennent respectivement le théorème des cosinus et le théorème de Pythagore. 
D'une manière analogue, on pourrait démontrer les autres théorèmes du cours 
scolaire. Aïnsi, les cinq groupes d’axiomes I-V considérés ci-dessus donnent 
(pour n — 2 et n — 3) une description axiomatique complète de la géométrie 
élémentaire *). 


Soit P un plan de l’espace X. Le vecteur a € R s'appelle orthogo- 
nal au plan P si pour des points quelconques À, B € P les vecteurs 


— 
a et AB sont orthogonaux. Si e,, ..., e, est une base du plan P, 
pour que le vecteur a soit orthogonal au plan P il faut et il suffit 
que le vecteur «a soit orthogonal à chacun des vecteurs e,, . .., ex. 


*) Ces axiomes de géométrie furent proposés par le géomètre allemand 
éminent H. Weyl. 
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Nous dirons que deux plans P,, P,c X sont orthogonaux si pour 
a 4 
des points quelconques À, B € P,; C, D € P, les vecteurs AB et 


Et 
CD sont orthogonaux *). Si l’on a dim P?, + dim P, — dim X, 
chacun des plans P,, P, s'appelle supplémentaire orthogonal de l’autre. 

Théorème 21.4. Pour tout point A, € X il existe un plan 
unique contenant ce point et formant le supplémentaire orthogonal d'un 
plan donné P& X. D'autre part, si le plan P" est le supplémentaire 
orthogonal du plan PC X, alors les plans P et P' sont complémen- 
taires entre eux (et par conséquent possèdent un seul point commun). 


Re 
Enfin, si le vecteur A,B est orthogonal au plan P, alors le point B ap- 
partient au plan P' qui passe par À, et qui est le supplémentaire orthogo- 
nal du plan P. 
Démonstration. Soient PE X, A, € X. Désignons par 
k la dimension du plan P et choisissons une base orthonormée e;, . . 
.., ex du plan P. Complétons ensuite le système de vecteurs ortho- 


normé e,, ..., €, de manière à obtenir une base orthonormée e;, . .. 
…..s Ch Ehtys + + + En del’espace X. 
Désignons par P, l’ensemble de tous les points de la forme 
B=A,+htte,uu+...+\e,. (21.3) 
où À*#1, ..., N° sont des nombres réels. Ainsi, P, est un plan de 
dimension nr — # dans X, contenant le point À,. On voit aussi que 
dim P + dim P, —k+(n —k) —=n = dim X. 


Enfin, pour des points quelconques 4, BE P,;C, D € P, nous avons 


— — , 
AB=ptle,s+...+ue,, CD=ute;+...+u"e 


et, par conséquent, les vecteurs AB et CD sont orthogonaux. Ainsi, 
P, est le supplémentaire orthogonal du plan P, ce qui en démontre 
l’existence. 

Démontrons l’unicité. Soit P, un plan passant par le point À; 
et formant le supplémentaire orthogonal de P. Démontrons que les 
plans P, et P, coïncident. Soit À un point du plan P,. Alors 

—— 


Ad=Me;+...+ie. (21.4) 


— 
Comme P, est le supplémantaire orthogonal de P, le vecteur 4,4 
est orthogonal à chacun des vecteurs e,, ..., ex. Il en découle que 
tous les coefficients À!, ..., À* dans la. relation (21.4) s’annulent. 


*) Remarquons que cette définition ne correspond pas à la terminologie 
traditionnelle de l’école, selon laquelle deux plans orthogonaux possèdent une 
droite commune. D'après la terminologie choisie ici, deux plans (de dimension 
deux) ne peuvent jamais être orthogonaux dans l’espace de dimension trois. 
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Ainsi, 


ss 
AoÀ = AMrtle, +... + 1e, 
ou 
A= A+ Menu +...+\e,, 


d’où l’on déduit que À € P,. Ainsi, P, € P,. Puisque 
dim P + dim P, — dim P + dim P, — dim X, 


on a dim P, — dim P, et, par conséquent, l'inclusion P,c P, im- 
plique que P, — P,, ce qui démontre l’unicité. 

D'autre part, puisque le sous-espace directeur ZL? du plan P 
est engendré par les vecteurs e,, . .., e,, tandis que le sous-espace 
directeur LP, du plan P, est engendré par les vecteurs ez+1, . .., e», 
on à Lp ® Lp, = R, i.e. les plans P et P, sont supplémentaires. 


— 
Enfin, si le vecteur A,B est orthogonal au plan P, ce vecteur 
satisfait à la relation (21.3) et donc B € P.. 
Théorème 21.5. On peut abaisser d'un point donné A, € X 
une perpendiculaire unique à un plan donné P& X. Autrement dit, 
es 
il existe dans le plan P un point unique B tel que le vecteur A,B soit 
orthogonal au plan P. La distance p (A,, B) s'appelle distance du point 
A, au plan P. 
Démonstration. Menons par le point À, un plan P,; 
formant le supplémentaire orthogonal du plan P et désignons par 
B le point commun des plans P et P,. Puisque 4,, BE P,, le vec- 


ES 
teur À,B est orthogonal au plan P, ï.e. le point B est le point cherché. 


— 

Si B' est un autre point du plan P pour lequel le vecteur 4,B” 
est orthogonal au plan P, on a, d’après le théorème 21.4, B° € P,, 
i.e. B' est le point commun des plans P et P, et par conséquent B° — 
— JB. 

Le point B dont l'existence et l’unicité ont été démontrées au 
théorème 21.5 s'appelle projection orthogonale du point À, sur le 
plan P. Ainsi, la projection orthogonale sur le plan P est une projec- 
tion de l’espace X sur le plan P parallèlement au plan P,, où P, 
est le supplémentaire orthogonal du plan ?. Pour cette raison, toutes 
les assertions indiquées dans les théorèmes 19.11, 19.12, 20.10 sont 
satisfaites pour la projection orthogonale. 

Exemple 21.6. Soient P, et P, deux plans parallèles de l’es- 
pace euclidien X. Alors, la distance du point À, € P, au plan P; 
ne dépend pas du choix du point 4, € P, et elle est égale à la distance 
d’un point quelconque B € P, au plan P,. Cette distance s'appelle 
distance entre les plans parallèles P, et P,.. 

En effet, supposons que 4,, 4, € P,; désignons par B, la projec- 

— 


tion orthogonale du point À, sur le plan P,. Le vecteur 4,4, appar- 
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tient au sous-espace directeur du plan P, et, par conséquent, au sous- 
espace directeur du plan P, (car P, || P,). Par conséquent, le point 


+ 
B;= Bi+ Aid 


—> 
appartient au plan P,. L'égalité ci-dessus entraîne 4,B, — A;,B. 
Puisque B, est la projection orthogonale du point 4, sur le plan P;, 


= 
le vecteur 4,B, est orthogonal au plan P,. Aïnsi donc, le vecteur 


Le 

A,B, est également orthogonal au plan P, et, donc, le point B, ap- 
partenant à P,, le point B, est la projection orthogonale du point À; 
sur le plan P,. Il est maintenant clair que la distance du point À; 
et du point À, au plan P, est la même: 


—— —— 
op (41, B;)=]|4:B: |=|A42B:|= Op (>, B2). 


Ainsi, la distance entre le point À € P, et le plan P, ne dépend pas 
du choix du point À € P,. 


= 

Remarquons enfin que le vecteur 4,B, est orthogonal non seule- 
ment au plan P,, mais aussi au plan P,, i.e. À, est la projection or- 
thogonale du point B, sur le plan P,. Par conséquent, la distance du 
point À, au plan P, (i.e. p (4;, B;)) est égale à la distance du point 
PB, au plan P,. 

Théorème 21.7. Soient (R, X) et (S, Y) des espaces euclidiens 
et f: X — Ÿ une application affine. IL existe alors un nombre M >> 0 
tel que pour deux points quelconques À, B € X on a la relation 


p (f (4), f(B)) = If(B) —f(4)I<MIB—-A]— 
— Mo (A, B). 
Démonstration. D'après (20.1) 


f(B)—j (4)=® (AB) =ç(B— A). 


Par conséquent, le théorème à démontrer découle immédiatement 
du théorème 16.15. 

Nous considérons maintenant les diverses manières de définir 
les hyperplans, les demi-espaces et les plans dans les espaces eucli- 
diens. 

Théorème 21.8. Soit (R, X) un espace euclidien. Pour toute 
fonction affine f : À — D, il existe un vecteur (et un seul) n qui sa- 
tisfait à la relation 


f(B)=jf(4)+nAB, A, BEX: (21.5) 
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ce vecteur sera désigné par le symbole grad f. Si, d'autre part, Q est un 
point fixe de l’espace X,n un certain vecteur et À un nombre réel, alors 
la formule 


f(B=1+nQB,  BEX, (21.6) 


détermine une fonction affine sur X pour laquelle grad f = n. 

Démonstration. Soit f: X — D une fonction affine. 
Alors pour deux points quelconques À, B € X on a la relation (voir 
(20.1)) : 


ss 
f(B)=7f(4)+ 9 (4B), 
où p: À — D est une forme linéaire. En vertu du théorème 16.16, 
nous avons 


— — 
p(AB)=nAB, 


où  — grad œ est le gradient de la forme linéaire . Ainsi, la relation 
(21.5) est satisfaite. 
Sin’ est un autre vecteur jouissant de la même propriété: 


f(B=f(A4)+n'AB, À, BEX, 


on peut soustraire cette relation de (21.5) et obtenir 
— 
(n—n')AB=—0, 


— 
quel que soit le vecteur AB € R. Il en découle que n — n° — 0, 
ie. R=N. 

La fonction (21.6) est affine puisque œ (a) —na est une forme li- 
néaire sur À (voir (20.2)). Le théorème est démontré. 

Soit maintenant l'un hyperplan de l’espace X et f: X — D 
une fonction affine non constante dont le noyau est l’hyperplan T. 
Le gradient de la fonction f sera noté n. Pour deux points quelcon- 
ques À, B ET’, nous avons f (4) — 0, f (B) = 0, en vertu de (21.5), 


— 
on a donc n AB — 0. Aïnsi, le vecteur nr est orthogonal 
à l’hyperplan F. 

Ainsi, si l'est un hyperplan et f une fonction affine non constante, 
dont le noyau est l'hyperplan T’, le vecteur n — grad f est orthogonal à 
l’hyperplan T'. Ce vecteur s’appelle vecteur normal de l’hyperplan T. 

Le vecteur normal de l’hyperplan l' peut également être obtenu 
de la manière suivante. Choisissons une base orthonormée e,, ... 

-.; €n1 de l'hyperplan l' et complétons cette base par un vecteur 
eh pour obtenir une base orthonormée e,, ..…,e, de l’espace X. Alors 
le vecteur Le,, pour tout À 0, n’est pas nul et orthogonal à chacun 
des vecteurs e,, . .., en-1, i.e. orthogonal à l’hyperplan l'. Autre- 
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ment dit, le vecteur Àe, (À 0) est le vecteur normal de l’hyperplan 
l'. Il est aisé de voir qu'avec les notations ci-dessus nous avons 
également la réciproque: si n est le vecteur normal de l’hyperplan 
l', alors n — Xe, (À = Ù). 

Théorème 21.9. Soient l'un hyperplan, À, un point de 
l'hyperplan T'et n le vecteur normal de l'hyperplan. L'hyperplan TV 
est alors défini par l'équation 


——— 
nAÀ=0, (21.7) 


i.e. le point À € X appartient à l’hyperplan T si, et seulement si, il 
satisfait à la condition (21.7). D'autre part, les deux demi-espaces ouverts, 
définis par l’hyperplan T', sont donnés par les inégalités 


— ——— 
nA A0, n AA <0, (21.8) 
i.e. le point À € X appartient au demi-espace positif (négatif) si, et 
— 


seulement si, le vecteur A,A forme avec le vecteur n un angle aigu 
(obtus). Enfin, les demi-espaces fermés, définis par l’hyperplan T, 
sont donnés par les inégalités 


—— _—— 
n AA >0, n AA 0. (21.9) 


Démonstration. Admettons que 
_——— 
f(4)= nÀ4,4, ACX. 


La fonction jf: X — D est affine et grad f — n. Si À est un point de 


—+ 
l'hyperplan [', on a nA,4 = 0 (le vecteur n étant le vecteur normal 
de l’hyperplan [}, i.e. f (4) — 0. Ainsi, TE Ker f, mais puisque les 
deux plans [', Ker f ont la même dimension r — 1, on a l' — Ker f. 
Ainsi, l'est le noyau de la fonction affine f, i.e. l'est défini par l’équa- 
tion f (4) — 0 ou, ce qui revient au même, par l’équation (21.7). 
Ensuite, les demi-espaces ouverts IT,, Il,, définis par l’hyperplan 
l', sont donnés par les inégalités f (4) > 0, f (4) < 0 (voir la dé- 
monstration du théorème 20.7), i.e. par les inégalités (21.8). 


— 
Enfin, l'inégalité nA,4 > 0 est vérifiée par les points pour 


— — 
lesquels nA,4 >> 0 et par les points pour lesquels nA,A = 0. Aïnsi, 
la première des inégalités (21.9) décrit l’ensemble II, UF — IT,, i.e. 
le demi-espace fermé correspondant. Il en est de même de la deuxiè- 
me inégalité (21.9). 

Définition 21.10. Soient [ un hyperplan, À, un de ses 
points et n son vecteur normal. Pour distinguer les demi-espaces 
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définis par l’hyperplan [', convenons de dire que le vecteur n est dans 
Le sens du demi-espace qui consiste en des points À satisfaisant à l'inégali- 


— — 
té nA,A > 0 (ou à l'inégalité nA,A > 0). Ainsi, si f : X—D 
est une fonction affine dont le noyau est l’hyperplan l', alors le vec- 
teur n — gradf est dirigé dans 
n=gradf & le sens du demi-espace positif 

À (fig. 53). 

Théorème 21.11. Soient A, un 
point de l’espace euclidien X et n;, ... 
…, NL ER des vecteurs linéairement indé- 
pendanis. Alors l'ensemble P de tous les 
points À € X qui satisfont aux relations 


_———> ==> 
ni454A=0, ..., n:494=—0, (21.10) 


est un plan de dimension n — k qui pas- 
se par le point À,. Chaque plan de di- 
mension n — k qui passe par le point À; 
peut être mis sous cette forme. 

Démonstration. Déterminons dans X les fonctions 
affines 





_— _——> 
fa (4) = n1404, ..., fr (4) = nrA4054. 
Alors, par hypothèse, les vecteurs 
Ni = Lrad fi, ..., Non = grad fr 


sont linéairement indépendants. Désignons par l'; le noyau de la fonc- 
tion affine ÿj;: 
F, — Kerf;, i —1,...,k. 


Alors, d’après le théorème 20.4, l'intersection l, M... N l, est 
un plan de X de dimension n — k. Or, cette intersection est décrite 
par les relations 

fi (4) =0, ..., fa (4) =0, (21.11) 


i.e. par les relations (21.10). Ainsi, le système d'équations (21.10) 
définit dans X un plan de dimension n — k. Il est évident que ce plan 
passe par le point À, (puisque À, satisfait aux relations (21.10)). 
En vertu du même théorème 20.4, tout plan de dimension 7 — 
qui passe par le point À, peut s’écrire sous cette forme. 

22. Topologie de l’espace euclidien. Soient © un point de l’es- 
pace euclidien (R, X) et r un nombre positif. L'ensemble de tous les 
points À € X qui satisfont à la condition 


p (O0, A)<7r 


s’appelle boule ouverte de centre O et de rayon r. Nous la désignerons 
par le symbole U, (0). 
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Soit maintenant H un certain ensemble de l’espace X. Le point 
O0 X s'appelle point intérieur de l’ensemble Æ s’il existe un nombre 
positif r pour lequel U, (0) H. 

L'ensemble G< X s’appelle ouvert (dans l’espace X) si ch a- 
que point À € Gest un point intérieur de cet ensemble. L'ensemble 
vide est également considéré comme ouvert. 

Exemple 22.1. Chaque boule ouverte U, (O) est un ensemble 
ouvert de X. En effet, supposons que À € U, (O0), ïi.e. p (O0, A) <r. 
Posons r’ = r — p (O0, A). Le nombre r” est positif et nous pouvons 
considérer la boule U,. (4) de centre À et de rayon r’. Pour chaque 
point B de cette boule nous avons p (4, B) < r' et, par conséquent, 
en vertu du théorème 21.1, 


p (0, B)<p (0, À) +p (4, B) <p (0, À) +r' — 
— p(O, A) +(r—p(0, À)) =r. 


Ainsi, p(O, B) <r, i.e. BE U,.(O). Nous avons donc démontré 
l'inclusion U,, (4) U, (O0), qui signifie justement que la boule 
U, (O) est un ensemble ouvert. 

Un ensemble F& X s'appelle fermé si son complément 
XX F(i.e. l’ensemble de tous les points de X qui n’appartiennent 
pas à F) est un ensemble ouvert. 

Exemple 22.2. La boule fermée de centre O et de rayon r, 
i.e. l’ensemble de tous les points À € X qui satisfont à la condition 
o (O0, À) <rest un ensemble fermé. En effet, le complément de cette 
boule fermée est l’ensemble G de tous les points À € X qui satisfont 
à la condition p (O0, À) > r. Supposons que À € G, i.e. p (O, A) > r. 
Posons r° = p (0, À) — r. Le nombre r° est positif et nous pouvons 
considérer la boule U, (4). Si B € U,, (A), i.e. p (A, B) <r',ona 


ep (0, B) = p (0, B) + p(B, À) — bp (B, À) > p (O0, À) — 
— p (B, 4) = p (0, À) —p (4, B)>p(0, À) —7r — 
— p(0, A) —(p (O0, À) —7r) = r, 


i.e. p(O, B)>ret, par conséquent, B € G. Nous avons donc dé- 
montré l'inclusion U,. (A) G, qui signifie justement que l’ensemble 
G est ouvert. 

Théorème 22.3. La réunion d'un nombre quelconque (fini 
ou infini) d'ensembles ouverts est un ensemble ouvert. L'intersection 
d'un nombre fini d’ensembles ouverts est un ensemble ouvert. L’intersec- 
tion d’un nombre quelconque (fini ou infini) d'ensembles fermés est un 
ensemble fermé. La réunion d'un nombre fini d’ensembles fermés est un 
ensemble fermé. 

Ce théorème se démontre sans peine à partir de la définition des 
ensembles ouverts et fermés. 

Soit maintenant 7 un ensemble de l’espace X. Considérons tous 
les ensembles fermés qui contiennent ÆH et désignons par 


12—01208 
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H l'intersection de tous ces ensembles fermés. D'après. 


le théorème 22.3, l’ensemble Æ est fermé, et c’est l’ensemble fermé. 
minimal qui contient À (i.e. si F est un ensemble fermé con- 
tenant À7, alors F = H). L'ensemble Æ s’appelle adhérence de l’en- 
semble X. | 

Le théorème suivant, dont nous omettons la démonstration qui 
est très simple, donne une description de l’adhérence en d'autres. 
termes. 

Théorème 22.4. Soit HE X. Le point À € X appartient 
à l’ensemble H si, et seulement si, pour tout r > 0 La boule U, (A) con- 
tient au moins un point de l’ensemble H. 

Le point À € X s’appelle point frontière de l’ensemble 7 € X si 
pour chaque r > 0 la boule U, (A) contient des points de l’ensemble 
IT ainsi que des points de son complément. L'ensemble consistant en 
tous les points frontières de l’ensemble }7 s’appelle frontière de l’en- 
semble } ; on la note bd }. 

Il découle du théorème 22.4 que bd H€ H. De même, bd H& 
c X X A, où X X Æ est le complément de l’ensemble Æ. Ainsi, on à 


bd H&HNXNXH.IIl est aisé de voir que l'inclusion inverse est 
également satisfaite, i.e. 


bd H—HNX\XH. 
On vérifie tout aussi facilement la relation 
H = H {| (bd A) 


qui montre que l’on obtient l’adhérence d'un ensemble en y ajoutant 
sa frontière. En se servant de la notion de frontière, on peut donner 
les définitions suivantes des ensembles ouverts et fermés : un ensem- 
ble est fermé s’il contient sa frontière : H = bd H ; un ensemble est ouvert 
s'il n'a pas de points communs avec sa frontière: H f (bd AH) = G. 

Rappelons maintenant la notion d'application continue. Soient 
(R, X) et (S, Y) des espaces euclidiens et H € X. Supposons don- 
née une application f: Æ — Ÿ qui fait correspondre à chaque point 
A € H un point f (A) de l’espace Y. L'ensemble Æ qui figure dans 
cette définition s'appelle domaine de définition de l’application f. 
L'application f: H — Y est dite continue si pour chaque point À € H 
et pour chaque nombre & > 0 on peut trouver un nombre Ô > 0 


tel que 
f (HN Us (A4) Us ( (4)). 


Aïnsi, cette définition signifie que si le point B € H se trouve à une 
distance de À inférieure à 6 (i.e. | A — B | < Ô, B € A), alors l'ima- 
ge f (B) du point B est située à une distance du point f (A) inférieure 
à &, i.e. | f (4) — f (B) |  &. Notons que le nombre Ô dépend en gé- 
néral aussi bien du point À que du nombre &, i.e. Ô — 6 (A, e). 
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Si l’espace Y coïncide avec la droite numérique D, toute applica- 
tion continue f : H —- D peut être appelée fonction continue. 

Théorème 22.5. Toute application affine d'un espace eucli- 
dien dans un autre est continue. 

La démonstration est immédiate d'après le théorème 
21.7. Il suffit de poser Ô — &/M et alors p (4, B) < 8 entraîne 
p (7 (4), f (B)) < &. 

Dans la démonstration considérée, pour chaque & => 0 on a su 
trouver un nombre 6 => 0 indépendant de À (i.e. valable pour tous 
les points À € H). Dans ce cas, l’application f: 4 — Y est dite 
uniformément continue. 

Nous énonçons les trois théorèmes suivants sans démonstration ; 
on les démontre dans les cours d'analyse. 

Théorème 22.6. Soient (R, X) et (S, Y) des espaces eucli- 
diens. Si le domaine de définition H de l'application continue j : H —- 
— Ÿ est un ensemble fermé borné de l’espace X, alors l'application f est 
uniformément continue et l’image f (H) est un ensemble fermé borné 
de l'espace Y. 

Théorème 22.7. Si le domaine de définition H d'une fonction 
continue f: H —- D est un ensemble fermé borné de l’espace X, alors la 
fonction f atteint sur H ses valeurs minimale et maximale, i.e. il existe 
des points A,, B, € H tels que pour chaque point À € I, on a les iné- 


galités 
Î (40) K f (A4) < f (Bo). 


Théorème 22.8. Soit jf: À — Ÿ une application continue, 
dont le domaine de définition est l’espace X. Alors, l’image inverse f-! (G) 
de tout ouvert GE Y est un ouvert de l’espace X, et l’image inverse 
fr? (F) de tout fermé FE X est un fermé de l’espace X. 

Exemple 22.9. Soit f: X — D une fonction affine non cons- 
tante. Cette fonction est continue (voir le théorème 22.5) et, par con- 
séquent, on peut appliquer à cette fonction le théorème 22.8. Puis- 
que l’ensemble qui consiste en un seul point © est fermé dans D, son 
image réciproque f-! (0) — Ker f est, d'après le théorème 22.8, un 
fermé de l’espace X. En vertu du théorème 20.2, il en découle que 
chaque hyperplan TE X est un ensemble fermé. Par conséquent (voir 
le théorème 20.4), chaque plan P & X est un ensemble fermé. 

D'autre part, puisque l’ensemble [0, ) de tous les nombres non 
négatifs et l'ensemble (—, 0] de tous les nombres non positifs sont 
des ensembles fermés de la droite numérique, on conclut que les en- 
sembles f-1 ([0, c)) et f-! ((— co, O]) sont fermés dans X. Autre- 
ment dit, les demi-espaces fermés (voir (21.9)) sont des ensembles fermés 
de l’espace X. D'une manière analogue, les demi-espaces ouverts (voir 
(21.8)) sont des ensembles ouverts de l’espace X. 

Exemple 22.10. Puisque chaque hyperplan TE X est un 
fermé (exemple 22.9), le théorème 22.3 implique que la réunion 


12% 
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T,U ... UT, d’un nombre quelconque fini d'hyperplans dans X 
est également un fermé. Nous montrerons que ce fermé n'est nulle 
part dense dans X, i.e. pour chaque point À € X et chaque nombre 
r > 0 il existe une boule entièrement contenue dans U, (A), qui n’a 


pas de points communs avec l’ensemble F,{[J ... [J[.. 
Considérons des fonctions affines non constantes f1, . .., fs, 

telles que l';, — Ker f;, i — 1, . .., s, et désignons par n,; le gradient 

de la fonction f;. Le plus grand des nombres | n, |, ..., | n, | sera 


désigné par &. Déterminons le point À, de la manière suivante: si 
f1 (4) 0, on admet que À, — À; si, par contre, f, (A) = 0, on 


admet que 4, — À + 5 n;. Dans le premier cas, il est évident que 


A, EU, (4) et fi (A,) 0. Dans le deuxième cas, 
FES r r r r 
p (4, A) =|44|= | nelle T9 
i.e. A, E U, (A). D'autre part, dans ce cas 
—> — : 
fa (A;) == 4 (À) + niAA;— n1AA;— n; (== n1) Z (0. 


20 

Ainsi, dans chacun des deux cas nous avons trouvé un point 4,€ 
E U, (À), tel que jf, (41) = 0. Autrement dit, À, € U, (A) et A, 
é T,,i.e. A, € X XT, et on a donc À, € U, (4) AN (X X D). 

Chacun des ensembles U,(4), X X VF, est ouvert (voir les exemples 
22.1, 22.9) et leur intersection l’est également. Le point 4, est donc 
un point intérieur de l’ensemble U, (4) NA (XX F,), i.e. il 
existe un nombre r, > 0, tel que 


U;, (41) € Ur (A)N (XX Ti). 


Autrement dit U,, (4) U, (4) et VU}, (A) XNT, La 
deuxième inclusion signifie que la boule U,, (4,) n’a pas de 
point commun avec l’hyperplan [',. Ainsi, on peut trouver 
une boule U,, (A,) contenue dans U, (4), et qui n’a pas de points 
communs avec l’hyperplan l',. 

On trouve de la même façon une boule U,, (42) Us (4;) qui 
n’a pas de points communs avec l’hyperplan T, (et avec l’hyperplan 
T',, d’après l'inclusion U,, (4,) € U,, (A:)). Ainsi, nous avons trou- 
vé une boule U,, (4,) € U, (4) qui n’a pas de points communs avec 
I,UT,. Trouvons maintenant (de la même manière) une boule 
Uz, (43) U, (A) sans point commun avec T,[Jl,Ul3, ete. En 
continuant cette procédure, nous obtiendrons une boule contenue 
dans U, (4) et qui n’a pas de points communs avec F,lJ ... {] L.. 

Exemple 22.11. Soient H€ X un ensemble et 4, € X un 
point fixe. Définissons sur X une fonction f en posant 


jf (4) = p (4; À), À € H. 
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On voit sans peine que la fonction est continue. En effet posons (pour 
un point quelconque À € H) 8 — &. Si p (4, B) << 6, alors 


< P (46, A) +8 = f(4)+e, 
f (4) = p (Aos À) < P (40, B) + p (B, À) < p (45, B) + 
+ p (4, B)<ÿ(B) + e. 
Ainsi, 
f(B)—f(4)<e, f(4) —f(B)<e, 


ie. |[f(B) —f(A)|<e. 

De la continuité de la fonction f et du théorème 22.7, on peut dé- 
duire l’assertion suivante: soient H un ensemble non vide fermé borné 
de X et AY,EX; alors la fonction 
f(A) — p (45, À), considérée sur 
l’ensemble MH, atteint ses valeurs 
minimale et maximale, i.e. on peut 
trouver dans H le point le plus 
proche de A, et le point le plus 
éloigné de À. 

Remarquons que si l’ensemble 
fermé H€ X n'est pas supposé 
borné, l’assertion de l'existence 
du point le plus proche de A, reste 
vraie. En effet, soit À un point de 
l’ensemble Æ. Désignons par Z la 
boule fermée de centre À, et de 
rayonr —p(4,, À) (fig. 54). Alors, 
l’ensemble Æ NN] À est fermé et non vide (il contient, par exemple, le 
point À). Par conséquent, il existe dans À NN] Z un point B, le plus 
proche du point 4,. Il est clair que B, sera également le point le plus 
proche du point À, dans l’ensemble Æ (les points de l’ensemble F 
qui n’appartiennent pas à l’ensemble Æ N Z étant situés à une dis- 
tance de À, supérieure à p (45, À)). 

23. Coordonnées. Servons-nous de coordonnées pour mettre sous 
forme analytique les relations considérées dans les numéros précé- 
dents. Considérons d’abord les faits qui se rapportent à l’espace affine 
(qu’on ne suppose pas euclidien). 

Soit (R, X) un espace affine de dimension n. Choïsissons une base 
Ey, - . -, en de l’espace vectoriel À et, en outre, choisissons un point 
O € X. Nous dirons que (0 ; e,, ..., e,) est un système de coordonnées 
dans l’espace affine X en question. Le point © sera appelé origine 
des coordonnées et les vecteurs e,, . .., e, vecteurs de la base. Cha- 
que point C € X s'écrit de façon unique sous la forme 


C—0+zre +... + zre,. 





Fig. 54. 
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Les nombres zx!, ..., x" figurant dans cette expression s'appellent 
coordonnées du point C dans le système de coordonnées considéré; 
nous écrirons 


CES re) 


Par ailleurs, tout vecteur «a € À se met de manière unique (pour la 


même base e,, ..., e,) sous la forme 
/ 
d—ye +... + y'er. 
Les nombres y!, ..., y" s'appellent coordonnées du vecteur &æ pour 


le système de coordonnées considéré ; nous écrirons 
a 1 n 
= f, s1 4 JU: 


Ainsi, lorsque l’on a un système de coordonnées (O0, e,, . .., e;), 
on peut considérer les coordonnées des points et des vecteurs. Par 
la suite, le système de coordonnées (0, e,, ..., e,) est supposé 
fixé (sans mention spéciale). 

Théorème 23.1. Si 


Ce cast DU nav 
alors 
= 
CD={yt— xt, DURS ee 7 | 
Démonstration. Nous avons 
C=0+xre, + CR so D = 0 +ye, + PE + Y'en; 
1.e. 
—> — 
OC=zxte;+...+zr'e,, OD=y'e +...+y'e,, 


et, par conséquent, 


—> —>  — 
CD—0OD—OC—(y—-xt)e;+...+(y"—x')es. 
Corollaire 23.2. Si 
GC = (27,  . £"), Œ — {y?, és 53 y"}, 


alors 
C+a—={(x Luyt, ..., ax + y"). 
Théorème 23.3. Si 
DDR D DEN ee D 
alors 
a +b= {rx +, ...,z"+uy"), a = {kx, ..., Àx"}. 


La démonstration est évidente. 
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Théorème 23.4. Si 
Ch 1e .:8 
et que le point C soit défini par les relations 
C=MC +... +MC,, où M+...LAf—1, (23.1) 


alors 
S 


C— ® Air, ..., Di Nat). (23.2) 


i=1 
Démonstration. La relation (23.1) signifie que 


— — — 
OÙ = MOC,+ ... HASOCS. 


Pour cette raison, la relation (23.2) découle de l'égalité évidente 
O — (0, 0, ..., 0), des théorèmes 23.1, 23.3 et du corollaire 23.2. 

Du théorème 23.4 on obtient sans peine plusieurs théorèmes 
(18.7, 18.8, 18.10, etc.) exprimés à l’aide des coordonnées. Nous les 
omettons. 

Théorème 23.5. Une application @ d’un espace affine dans 
un autre est une application affine si, et seulement si, on peut l'écrire 
à l’aide de coordonnées par des formules linéaires (non homogènes). 

Démonstration. Soient (À, X), (S, Y) des espaces 
affines et supposons que X est muni d'un système de coordonnées 
(O ; e,, ..., e,) et que Ÿ est muni d’un système de coordonnées 
(0'; e;, ..., em). Posons 


Co = ©, C, = 0 +e:, Ca = 0+es, “83 Cr =0+e,;, 
de sorte que 
Ci (0050 00) C6 0, 0:55 0h 


(23.3) 
Ca = (0, 1,0, ..., 0), ..., Cn = (0, 0, 0, ..., 4). 


Supposons maintenant que @: X — Ÿ est une application affine et 
que les points 


D, = P(Co), Di = p (C1), - .., Dh = q (Ci) 


ont relativement au système (0; e;, ..., em) les coordonnées sui- 
“vantes: 


D;=(b},...,0),  i—0,1, 


Choisissons un point C — (xl, ..., x") € X et notons les coor- 
données de son image D — @ (C) par y!, ..., y": 


= (y, ..., y). (23.4) 
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Il nous faut exprimer les coordonnées y!, ..., y” en fonction de 
x', ..., x”. Puisque 
C—0+zrte +... +zr'e, = Co + x! (Ci — Co) + .. 
+ (Ch — Co =U—-zt— ... — x) Co + C, + 


+... + 2"C,, 
on a, en vertu des théorèmes 19.1 et 23.4, 
D=(—zt—...—2:2 D,+zxtD;+...+a"D, — 
= ((—at— ...—2 bi Lab +... +afbr, .…. 
, (—at—...—2) bp tabl +... Lrbr). 
En comparant cette écriture avec (23.4), nous obtenons 
= (at... —2")bi+ 
+atbi +... +zx"bi, i—4À,..., m. (23.5) 


Ainsi, l’application œ s'exprime linéairement en fonction des coor- 


données. 
Réciproquement, supposons qu'une application ®: À — Ÿ s'écrit 
en coordonnées à l’aide d'expressions linéaires : 


y=aiai+...+Laix" toc, Lies, (23.6) 
i.e. l’image du point C — (x!, ..., x") € X par l'application 
est le point D — (y, ..., y”) E Y, dont les coordonnées peuvent 


être calculées par les formules (23.6). Il découle immédiatement du 
théorème 23.4 que si € — (1 — À) C” + AC”, alors œ(C) = (1 — 
— À) p(C') + Àp(C”), i.e. l’application œ est affine. 
Corollaire 23.6. Chaque fonction affine f: X — D s'exprime 
à l’aide de coordonnées sous la forme 
ft, ...,a9=d—at— ... — x b, + xt, +. 
. + x"b,, (23.7) 


où 0; = f (Ci), = 0,1; 1 (Noir (29.9); (25. 9)). 
T he éorème 23.7. Chaque hyperplan TE X s'exprime à l'aide 
de coordonnées par l'équation 
At + Ado? + ... + A,z" + B — 0, (23.8) 
où au moins un des coefficients A, . .., À, est différent de zéro. Ré- 
ciproquement, chaque équation de cette forme détermine dans X un cer- 


tain hyperplan. Ensuite, les demi-espaces ouverts, définis par l’hyper- 
plan (23.8), sont exprimés à l’aide de coordonnées par les inégalités 


At! + A2 + ...+A,x" + B> 0, | 23.9) 
Auat + As + ...+ A,x" + B <0, | 
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et les demi-espaces fermés correspondants par les inégalités 
Aux! + Aa? +... + A,x" + B>0, ) 
2" + Ag +... + Ar + 2340) 
Ati + Aot? + ...+A,1x" + B<0. 


Démonstration. Soient FL un hyperplan et f: X —+ D 
une fonction affine non constante dont le noyau est l’hyperplan T'. 
La fonction f s'écrit en coordonnées par la formule (23.7), i.e. la for- 
mule 


fat, ..., a) = Aya! H A, + ... + A,x° + B, 


où nous avons posé 
A3 = D — 05, ..., An = On — b,, B = 0,. 


Si tous les coefficients À,, . .., À, de cette formule étaient nuls, la 
fonction f serait évidemment constante, ce qui contredit les: 
propriétés de notre construction. Par conséquent, au moins un des: 
coefficients À,, ..., À, est non nul. 

Maintenant, l'égalité f (A) — O0 qui détermine l’hyperplan I" 
se met sous la forme (23.8), tandis que les inégalités jf (4) > 0, 
f (4) < 0, qui déterminent les demi-espaces ouverts, ainsi que les. 
inégalités f (4) > 0, f (A) L 0, qui déterminent les demi-espaces: 
fermés, prennent la forme (23.9) et (23.10). 

Réciproquement, si on a une équation de la forme (23.8) dans la- 
quelle au moins un des coefficients À,, ..., À, est non nul, son 
premier membre détermine d'après le théorème 23.5, une fonction 
affine non constante sur X et, par conséquent (selon le théorème 20.1), 
l'équation (23.8) détermine un hyperplan. 

Théorème 23.8. Les hyperplans 


Ayxt+ ...+ 4,2" + B=0, (23.11) 
Aiti+...+ An" + B'=0 (23.12): 

coincident si, et seulement si, il existe un nombre k -£ 0, tel que 
A1=#%A,, A,=kA,, ..., An=kArn, B=kB'. (23.13) 


Démonstration. Désignons par f, f’ les fonctions affines 
figurant dans les premiers membres des relations (23.11), (23.12). 
Ainsi, l’équation (23.11) définit un hyperplan l — Ker f et l’équa- 
tion (23.12) un hyperplan L” — Ker f’. Il est clair que si l’on a les: 
relations (23.13), i.e. f — kf', alors les hyperplans T' et l” coïncident. 

Démontrons la réciproque. Supposons que I — I”. Choisissons: 
n points libres C;, C:, ..., C, de l'hyperplan T. Soit C, un point. 
qui n'appartient pas à cet hyperplan. Alors 


f(Cd= 14 SC) =0 CA 
f'(C) = ... =f (Cr) = 0, f (Co) Æ 0. 
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f (Co) 
f' (Co) ” 





En posant k — nous voyons que les relations suivantes 


sont vérifiées : 


f (Ci) D kf' (Ci), i — 0, 1, ss 


Ainsi, la fonction affine f — kf’ s’annule en tous les points C;, 
Cu, + : +, Cn. La fonction affine identiquement nulle s’annule éga- 
lement en tous ces points. Mais alors, en vertu de l’unicité (théorème 
19.9), ces fonctions affines coïncident (les points Co, Cy, + : +, Cn 
étant libres), i.e. f— kf — 0. Autrement dit, 


(A—kA;at+...+(4—kA;) x" +(B—k%B")=0, 


quel que soit le point (x!, ..., x"). Par conséquent, les relations 
(23.13) sont vérifiées. 

Théorème 23.9. Les hyperplans (23.11), (23.12) sont paral- 
lèles si et seulement s'il existe un nombre k=£0, tel que 


Ai=kA!, ..…, A, =kA, (23.14) 


Démonstration. Considérons les fonctions affines f, f 
introduites pour démontrer le théorème précédent. Il est clair que si 
les relations (23.14) sont vérifiées, les hyperplans l' = Kerf et 
T' — Kerf’ sont parallèles (voir le théorème 20.5). 

Démontrons la réciproque. Supposons que [' || I”. Choisissons un 
point C E [” et posons À — f (C). Alors, la fonction affine f, = f — À 
jouit de la même propriété que f, (C) = f (C) — À = 0, i.e. l’hy- 
perplan Ker jf, passe par le point C. D'autre part, l'hyperplan Ker f; 
est parallèle à l’hyperplan F (théorème 20.3) et, par conséquent, 
à l’hyperplan I”. Ainsi, les hyperplans [” — Ker jf” et Ker jf, sont 
parallèles et possèdent un point commun ; on a donc Ker jf, = Ker j’ 
(théorème 18.6). Autrement dit, les hyperplans 


Aux + ... + Az" + (B — À) = 0, 
A;xt+...+4,x"+ B'=0 
coïncident et alors le théorème 23.8 implique les relations (23.14). 


Passons maintenant à la description en coordonnées des faits 
qui se rapportent à l’espace euclidien. 


Théorème 23.10. Si le système de coordonnées (0; e;, . .., eh) 
est orthonormé (i.e. la basee;, . . ., e, est orthonormée) la distance entre 
les points 


C=(x,...,x7), D = (y, ..., y) 
se détermine par la formule 
p(C, D)= Vu — ap +... + — TT. 


La démonstration est immédiate d’après les théorèmes 23.1 et 


16.9. 
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Théorème 23.11. Supposons qu'un système de coordonnées 


orthonormé (O; e,, . .., eh) est défini dans un espace euclidien (R, X). 
Alors, le gradient de la fonction affine 
FOR Le PAT ue marre 


est égal à grad f — {A,, ..., Ah}. 
Démonstration. Désignons par n le vecteur {4,, ... 
..., An}. Alors, pour deux points quelconques 


Ce resp), D se 0) 
de l’espace X nous avons 
f(D)—j(C)= 
= (Ayt +... + Any + B)— (Aux +... + Az" + B)— L 
= A (y—a)+ +4, (ÿ— a) = nCD, 
{voir les théorèmes 23.1 et 16.9), ce qui signifie justement que n — 


— grad f (voir (21.5)). 
Corollaire 23.12. Supposons que l’hyperplan 


Ayat+ ... + A, zx + B —0 


est défini dans un système de coordonnées orthonormé. A lors, le vecteur 
n —= {A:,..., A,} est orthogonal à cet hyperplan. 

Théorème 23.13. Supposons qu’un système de coordonnées 
orthonormé a été introduit dans un espace euclidien (R, X) de dimension 
n et on se donne k hyperplans 


Ayat+ ...+À4,;,x"+B;—0, L — 17 ..., k. (23.15) 
Si Les vecteurs 
n;={A;, ..., Ai}; i— 1, .. k, 


sont linéairement indépendants, l'intersection de tous les hyperplans 
(23.15) est un plan de dimension n — k dans X. Chaque plan de dimen- 
sion n — k de l’espace X peut être mis sous cette forme. 

La démonstration est immédiate d’après les théorèmes 
23.11 et 20.4. 

Remarque 23.14. Le théorème 23.13 est de nature affine, 
i.e. il est vrai non seulement dans un espace euclidien, mais dans un 
espace affine quelconque. En effet, en choisissant dans l’espace aïfi- 


ne (R, X) un système de coordonnées (0; e,, . .., e,), nous pouvons 
introduire dans À un produit scalaire en posant 
ES M à 


(où les coordonnées des vecteurs sont choisies dans le système de 
coordonées considéré). Alors (R, X) deviendra un espace euclidien et 
le théorème 23.13 sera applicable. 
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Théorème 23.15. La boule ouverte de centre O = (a*, . . .a") 
et de rayon r est définie par l'inégalité 


{ct — a +... La — a} <r 
et la boule fermée correspondante, par l'inégalité 
{at — al +... + (xt — a} <Lr° 


(le système de coordonnées étant orthonormé). 

Cela découle immédiatement du théorème 23.10. 

Pour conclure, considérons la notation en coordonnées des appli- 
cations continues. Soient (À, X}), (S, Y) des espaces euclidiens de 
dimension quelconque et supposons donnée une applicaton f: H — 
+ Y,où HE X. Introduisons un système de coordonnées (0; e;, . .. 


.…, €n) dans l’espace X et un système (0°, e;, ..., Em) dans 
l'espace Y. Enfin, choisissons un point C = (xt, ...,x")€EH et 
désignons par y, ..., y” les coordonnées du point f (C) € Y. 

Le point C — (et, ..., &*) € H étant donné, le point f (C) — 

— (yl, ..., y”) se définit de manière unique, i.e. les nombres 

yl, ..., y" se définissent uniquement. Autrement dit, chacune des 

coordonnées yl, ..., y” du point f (C) est une fonction définie sur 
l’ensemble 77: 

y = gi(xl, ..., zx"), =, sas mn (23.16) 


Ainsi, l'application f: H—Y définit m fonctions g': A —D 
(voir (23.16)). 

Il est clair que, réciproquement, des fonctions quelconques 
(23.16) définies sur l’ensemble 7, font correspondre à chaque point 
(xt, ..., x”) € H un point unique 


A CE 0 OO CA D CR D 
LS Mes) 


de l’espace Y, i.e. elles définissent une application f: H — Y. 

Nous voyons que la définition d'une application f: H — Ÿ est 
équivalente à la définition des fonctions (23.16) sur l'ensemble H. 
La famille des fonctions (23.16) est l'expression de l’application 
f:H—--Y à l’aide des coordonnées. 

Désignons pas l'; l’hyperplan de l’espace Y qui passe par le point 
O" et a pour base e;, ..., ei_1, €iss, . . ., Em, et par P; la droite 
qui passe par le point O0” et pour laquelle ei est le vecteur directeur. 
Sur la droite P; considérons le système de coordonnées (0”; ei). Les 
plans l'; et P; sont supplémentaires. 

La projection de l’espace Y sur la droite P;, parallèlement à l’hy- 
perplan l'; sera notée x;. Pour chaque point (y!, . .., y”) € Y nous 
avons 


a (yt, ..., y)= nt; (0'+yle; +... +y"em) = 0" + y'ei=(y"), 
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i.e. la projection du point (y!, ..., y”) sur la droite P; 
a pour coordonnée y‘. Il en découle que le nombre ri CRU D à 
i.e. la i-ème coordonnée du point f (C) = f(x, ..., x"), est égal 


à la coordonnée (sur la droite P;) du point x; (f (C)) = (x;i°f) (C). 
L'application x; étant continue (voir les théorèmes 19.11 et 22.5), 
il en découle immédiatement que si l’application f: H — Y est con- 
tinue, les fonctions (23.16) le sont aussi. La réciproque se démontre 
tout aussi facilement. 

Ainsi, l'application f: H —- Ÿ est continue si et seulement si les 
fonctions, qui permettent d'exprimer cette application en fonction des 
coordonnées, sont continues. 


CHAPITRE III 


ÉLÉMENTS DE LA THÉORIE DES ENSEMBLES 
CONVEXES 


$ 6. Ensembles convexes 


24. Définition d’un ensemble convexe. Dans ce qui suivra nous 
noterons £" — (R, X) l’espace euclidien de dimension n. Pour les 
points, ainsi que pour les vecteurs, nous écrirons les inclusions À € 
CET,a € ET (au lieudeAEX,aE€ R). 

Soit V un ensemble de points de l'espace Æ£". L'ensemble W 
s'appelle convexe, si pour deux points quelconques À, B de cet ensem- 
ble le segment [4, B] est entièrement contenu dans l’ensemble NV 





Fig. 59 Fig. 56 


(fig. 59). Pour nr = 2 (i.e. dans le cas où £” est le plan euclidien), 
on peut indiquer les exemples d’ensembles convexes : triangle, paral- 
lélogramme, trapèze, disque, ellipse. L'ensemble représenté sur la 
figure 56 n'est pas convexe. 

Citons des exemples d’ensembles convexes dans l’espace Æ£*, im- 
portants par la suite. 

Tout plan (de dimension arbitraire) est un ensemble convexe de l'es- 
pace E”. En effet, soient À et B deux points quelconques du plan P. 
Alors, pour tout nombre réel À, le point (1 — À) À + ÀB appartient 
également au plan P (voir le n° 48). D'où il découle que [A, Blc P, 
c'est-à-dire que l’ensemble P est convexe. 

Tout demi-espace est un espace convexe de l'espace E". En effet, soit 
II un demi-espace fermé, [ l’hyperplan qui le délimite, Q un point de 
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l’hyperplan let n le vecteur orthogonal à l’hyperplan FT dirigé vers 
le demi-espace II. D'autre part, soient À, B deux points quelconques 


— — 
du demi-espace IT. Alors, nQA >0, nQB > 0. Soit maintenant C 
un point du segment [A, B]l; on a alors la relation (17.6), où 0 < 
Z À LA, et, par conséquent, 


nQC= n ((1— 2) QA-+AQB)=(1— A) nQÂ+nQB>0. 


Ainsi, C € II. Nous avons donc montré que [A, Blc II, i.e. que l’en- 
semble II est convexe. (On démontre d’une manière analogue que tout 
demi-espace ouvert est également un ensemble convexe.) 

La boule fermée de centre Q et de rayon r >0 est un ensemble convexe. 
En effet, soient À, B deux points de la boule considérée, i.e. 
po (0, A) <r, p (Q, B) Lr. Soit, ensuite, un point C du segment 
[4, B1, i.e. l’on a la relation (17.6) pour 0 &À < 1. Vu les relations 


— — 
[O4 [=p(Q, A)<r, [QB|]—=6p(Q, B)<r et (16.2), nous 
obtenons : 


— — 


LOC P= QC2= ((41— 2) QA+ 10BY — 
_ ps _ 
(411042422141 —2) OAOB + MOB< 


— es _" 
<(1—AP|QAP+21(1—2) QAI|QBI+VIOBP< 
L(1— A) r2+21(1—À)r2+ A2r2= r2, 


=. 

Ainsi, | QC |<r, i.e. le point C appartient également à la boule 
considérée. Nous avons donc démontré que tout le segment [4, 3] 
appartient à la boule, qui est donc un ensemble convexe. (On démon- 
tre d'une manière analogue que la boule ouverte U,(Q) de 
centre Q et de rayon r est un ensemble convexe.) 

Théorème 24.1. L'intersection d’un nombre quelconque d’en- 
sembles convexes est également un ensemble convexe. 

Démonstration. Considérons l'intersection de deux en- 
sembles convexes (l’intersection d’un nombre d’ensembles convexes, 
y compris l'intersection d’un nombre infini d’ensembles con- 
vexes est examinée d'une manière analogue). Soient 7 et N des en- 
sembles convexes. Soient, d'autre part, À et B deux points quelcon- 
ques de l’ensemble P — M N N et C un point du segment [A, B]. 
Puisque À € P, le point À appartient à chacun des ensembles 
M, N de même que le point B. Puisque À € M, B € M, le segment 
[A, BI] appartient, d’après la convexité de l’ensemble 47, à l’ensem- 
ble M et, par conséquent, C € M. De même, comme AE N, BEN, 
on a, d’après la convexité de l’ensemble W, l'inclusion NW = [4, B] 
et, par conséquent, C € N. Ainsi, le point C appartient à chacun des 
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ensembles M, N,i.e. CE M AN N = P. Nous avons donc déduit que 
chaque point C du segment [A, B] est contenu dans l’ensemble P, ï.e. 





Fig. 57 


[A, BIC P et l’ensemble P est donc con- 
vexe. Le théorème est démontré. 
Remarquons que l'intersection de plu- 
sieurs ensembles convexes peut être vide. 
Par exemple, la fig. 57 représente trois 
ensembles M,, M>:, M3, dont l'intersection 
deux à deux est non vide, mais l'intersection 
des trois ensembles 7, N M: N M,est vide. 
Puisque chaque demi-espace est un en- 
semble convexe de l’espace Æ7, on voit 
d’après le théorème démontré que l’in- 
tersection de tout nombre de demi-espaces 
est également un ensemble convexe. Nous 
nous intéresserons maintenant à l’intersec- 
tion d’un nombre fini de demi-espaces. 


Considérons d’abord le cas nr — 2, i.e. le cas des figures planes. 
Il nous faudra alors parler de l'intersection d’un nombre fini de 


LC > à se 


WW V2 


ê) C/ 
Fig. 58 


demi-plans. L'intersection de deux demi-plans peut être 
un angle (en particulier, un demi-plan), une bande ou une ligne droite 


(fig. 58). Ainsi, l'intersection de deux demi-plans (si elle n’est pas 
vide) sera toujours une figure non bornée. L'intersection de 
trois demi-plans est soit une figure non bornée (fig. 59), soit un 
triangle ou un point (fig. 60} Quatre demi-plans peuvent 
avoir une intersection qui est (en plus des cas déjà considérés) un 
quadrilatère convexe ou un segment (fig. 61). 
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En général, l’intersection de plusieurs demi-plans peut être soit 
une figure non bornée, soit un point, un segment ou un polygone con- 
vexe. On peut donc s’imaginer un polygone convexe comme étant 
l'intersection d’un nombre fini de demi-plans (fig. 62): il suffit de 
prendre autant de demi-plans qu'il y a de côtés à notre polygone. 

Si nous convenons de considérer le point comme étant un polyèdre 
de dimension zéro, le segment comme un polyèdre convexe 
de dimension un, et 
le polygone convexe comme 
étant un polyèdre de d i- 
mension 2, on peut alors 
dire que l'intersection d’un 
nombre fini de demi-plans, si 
toutefois elle est non vide et 
bornée, est un polyèdre convexe 
(de dimension zéro, un ou 
deux). 

La situation est analogue 
dans l’espace à trois dimen- Fig. 60 
sions : l'intersection d’un nom- 
bre fini de demi-espaces (si toutefois elle est non vide et bornée) 
est soit un polyèdre de dimension zéro (un point), soit un polyèdre 
convexe de dimension un (un segment), soit un polyèdre convexe de 
dimension deux (i.e. un polygone convexe situé dans un certain 
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Fig. 61 Fig. 62 


plan), ou, enfin, un polyèdre convexe de dimension trois (i.e. un 
polyèdre convexe dans le sens usuel du terme). 

Dans l’espace de dimension #, pour nr > 3, nous ne possédons pas 
J'intuition spatiale qui nous était si utile pour la considération des 
figures du plan et de l’espace à trois dimensions. Le mot « polyèdre » 
n’évoque donc pas en nous l'impression visuelle d’un corps dans l’es- 
pace de dimension n. En vertu de quoi, l’assertion démontrée ci- 
dessus est utilisée dans le cas de l’espace de dimension nr comme 
définition du polyèdre convexe: l'intersection d’un nombre 


13—01208 
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fini de demi-espaces fermés s'appelle polyèdre convexe, si c’estun en- 
semble borné non vide. 

Chaque polyèdre convexe est un ensemble convexe, 
car il contient tout segment dont les extrémités lui appartiennent 
(comme chaque demi-espace est convexe, et l'intersection d’ensem- 
bles convexes est également un ensemble convexe d’après le théorè- 
me 24.1). La réciproque est évidemment fausse : un ensemble con- 
vexe n’est pas nécessairement un polyèdre convexe. Par exemple, la 
boule de l’espace de dimension 
n est convexe (pour n > {) 
mais n’est pas un polyèdre 
convexe. 

Un des polyèdres convexes 
les plus simples dans l’espace 
de dimension n est le parallé- 
lépipède de dimension n, défini 
à l’aide de coordonnées par 
les inégalités 


A PO RS 
Fig. 63 .., da <b, (241) 


où at <Lbl, a <Lb,..., a" < b". Remarquons que pour n = 2 
les points (x!, x?) dont les coordonnées satisfont aux inégalités (24.1) 
forment un rectangle (fig. 63). Pour nr — 3 les inégalités (24.1) déter- 
minent dans l’espace aux coordonnées x}, x°?, x° un parallélépipède. 

Il est facile de comprendre que le parallélépipède de dimension n 
est effectivement un polyèdre convexe en récrivant les inégalités 
(24.1) sous la forme 


DRE, De 0, Lau D AU D '0 ASUS LIST LU. 





Chacune des inégalités ci-dessus définit un demi-espace (voir théo- 
rème 23.7), et puisque chaque parallélépipède de dimension » est 
formé de points qui satisfont à la fois à toutes les inégalités, il est 
l'intersection de 2n demi-espaces. D'autre part, le parallé- 
lépipède de dimension nr est également un ensemble borné. Il est 
donc un polyèdre convexe. 

25. Enveloppe convexe. On appelle enveloppe convexe d’un en- 
semble F l’ensemble convexe minimal qui contient F. Un tel 
ensemble convexe minimal doit nécessairement exister, puisque l’in- 
tersection de tous les ensembles convexes qui contiennent F sera 
justement l’ensemble convexe minimal contenant F. Nous noterons 
par la suite l’enveloppe convexe de l’ensemble F par conv F. 

La fig. 64 représente un ensemble F (hachuré) et la courbe (en 
pointillé) qui limite son enveloppe convexe. L'enveloppe convexe de 
trois points non situés sur une même droite est un triangle. On 
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peut se faire une idée de l’enveloppe convexe d’une figure plane F 
en imaginant un fil élastique tendu autour de cette figure (comparer 
à la fig. 64). L'ensemble limité par le fil tendu sera justement l’en- 
veloppe convexe. Dans l’espace à trois dimensions on peut imaginer, 
d’une manière analogue, une membrane élastique (une « bulle ») 
qui entoure l’ensemble F; le corps 
limité par la membrane tendue sera 
l'enveloppe convexe. Il va de soi 
qu'une telle représentation visuelle ne 
peut remplacer la description exacte 
de l'enveloppe convexe; elle est en 
plus inapplicable pour n > 3. 

Le théorème suivant donne une 
description algébrique exacte de l’enve- 
loppe convexe d’un ensemble quel- 
conque F. 

Théorème 25.1. Pour qu'un 
point C  appartienne à l'enveloppe 
convexe de l’ensemble FE E" il faut et il suffit que l’ensemble F 
contienne les points Ao, Ay, + . ., À, (non nécessairement tous distincts) 
et qu'il existe des nombres M0, À, ..., N° tels que l’on a les relations: 


M>0, M>0,..., DO, MEAL ... + NT = 1,(25.1 
C= MA, + MA, + ... + 204,. (25.2) 
Démonstration. Notons F* l’ensemble des points C 
pour chacun desquels il existe un entier positif m, des points À4,, 


A1, :.., Am de l’ensemble F et des nombres À, À, ..., À" tels 
que l’on a les relations 





MU A0, sen de 0 Mail). Let 
(25.3) 
C = A0 + MA, +... + NA. (25.4) 


Remarquons que dans les relations (25.3) et (25.4) le nombre m 
n’est aucunement lié à la dimension nr de l’espace considéré et, de 
plus, qu’à chaque point C de l’ensemble F* peut correspondre s a 
propre valeur de m. 

Démontrons que l’ensemble F* est convexe. Soient C et D deux 
points quelconques de l’ensemble F*. Alors, pour le point C', on peut 
trouver un nombre m, des points À,, 4:,,..., A, et des nombres 
A0, À, ..., À satisfaisant aux relations (25.3), (25.4) et, pour le 
point D, un entier positil p, des points B,, B;,, ..., B, et des 
nombres u°, ul, ..., u? qui satisfont aux relations 


u>0, n° 20,..., 20, w+u +... +pP=1, 
D = pB, + u'B; + ... + uPB,. 
13% 
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Soit maintenant Æ un point du segment [C, DI. Alors, 
E=(1—-v)C+vD 


(comparer à (17.6)), où le nombre v satisfait aux relations 0 < v < 1, 
de sorte que les deux nombres v, 1 — v sont non négatifs. Nous avons 


E — (1 — v) (A4 + MA +... H'AMA,,) + 
+ v (LB + PB: +... +uPB,) = NA — v) 46 + 
+MA—-v)A4 +... HAT —v) 4, + uwvB, + 
+ ulvB, + ... + uPvB, (25.5) 


(remarquons que si parmi les points À; et B; certains coïncident, on 
peut réduire les termes semblables dans le deuxième membre, ce qui, 
d’ailleurs, n’a pas d’ importance). On voit facilement que tous les 
coefficients du deuxième membre de la relation (25.5) sont non né- 
gatifs et leur somme est égale à 1: 


NA —v) LA — v) +... HAT — v) + uv + 
+ plu +... +uPv = A —v) HUE... HAT + 
+ v (ut +ut+ ... +u)=({—v)1i+vai = tft. 
Mais alors l’égalité (25.5) signifie que le point Æ appartient à l’en- 
semble F*. Ainsi, chaque point Æ du segment [C, D] appartient 


à l'ensemble F*, donc [C, D] F* et, par conséquent, l’ensemble 
F* est convexe. 

Il est clair, d'autre part, que l’ensemble F* contient F : pour tout 
point C € F nous pouvons poser m = 0, À, — C, À? — 1 et écrire: 
C = ÀA,, de sorte que le point C satisfera aux relations (25.3) 
et (25.4). 

Démontrons maintenant que chaque ensemble convexe M] con- 
tenant } contient également F*. En effet, supposons M = F et choi- 
sissons un point C de l’ensemble F* qui satisfait aux relations (25.3), 
(25.4). Nous pouvons alors admettre (en se débarrassant, s’il le faut, 
des termes superflus dans (25.4)) que tous les nombres A9, Al, ... 
..., A7 sont positifs. Désignons par PB; le point déterminé 
par la relation 

À . 
B, = —————— (14, + MA, +...+1'À;), 29.6 
CENTER ES 918) 
ES RS 
Un calcul direct nous montre que les relations 

04 î 
joie. rt 
i—0, 1,..., m—1. 


Bu Vv;B;+(1—v;) A;;4, où v,— 
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sont valables. Il est alors clair que le nombre v; satisfait à la condi- 
tion 0  v;, << 1. Mais puisque le point B, coïncide évidemment avec 
A) (voir C5. 6)), la relation (25.7) pour i — 0 se met sous la forme 
B, = Vo40 + (4 — v,) À,. Par conséquent, B,€ [4,, Al. Mais les 
deux points A, À. appartiennent à l’ensemble F, et donc à l’ensem- 
ble M (puisque M = F). Par conséquent [4,, 411 M (l’ensemble 
M étant convexe); en particulier, B, € M. Pour i — 1, la relation 
(25.7) prend la forme B, = v, B;, + (1 — v,) A:, de sorte que B, € 
€ [B1; Al. 

Mais [B,, A) M (car BEM, A,€EF & M et l’ensemble 
M est convexe). Par conséquent B, € M. Continuant de la même 
manière, nous montrerons que tous les points B,, B;, B:, ..., Bm 
appartiennent à l’ensemble A7, mais il découle directement des rela- 
tions (25.3), (25.4), (25.6) que By — C. Aïnsi, tout point C de l’en- 
semble F* appartient à l’ensemble M, i.e. F*€C M. 

Nous avons démontré que F* est un ensemble convexe contenant 
F et contenu dans chaque ensemble convexe 7 qui contient F. 
Autrement dit, F* est l’ensemble convexe minimal qui con- 
tient #, donc, F* — conv F. 

Nous pouvons déduire de ce raisonnement que la condition énon- 
cée dans le théorème 25.1 est suffisante: sile point C satis- 
fait aux relations (25.1), (25.2) (i.e. aux relations (25.3), (25.4) pour 
m = n), alors C € F*, et le point C appartient donc à l’enveloppe 
convexe de l’ensemble F. 

Démontrons la nécessité. Soit C un point de l'enveloppe 
convexe conv } de l’ensemble F. Alors, d’après ce que nous avons 
démontré, le point € doit satisfaire aux relations (25.3), (25.4), 
(où les points 4, As, - .., An appartiennent à #). Si m — n, (25.3) 
et (25.4) sont les relations cherchées (ï.e. elles ont la forme exigée 
(25.1), (25.2)). Pour m << n, on obtient la forme requise en ajoutant 
au deuxième membre de (25.4) plusieurs termes nuls, i.e. en posant 


A = A2 — ,,, — À" — 0 et en choisissant pour ÀA,,14, . .. 
., À, des points _ quelconques de l’ensemble 7 (par exemple 
A m1 = ur A — es — À} = = A5): 


Il ne reste qu’à considérer le cas m > n. Ainsi, supposons que le 
point C satisfait aux relations (25.3), (25.4), où m> n. 

On peut alors supposer que tous les nombres AÀ°, A!, ..., À” 
sont positifs. Considérons les vecteurs 


Comme le nombre m de ces vecteurs est supérieur à n, ils sont linéai- 
rement dépendants: 


— ——> 
at AA + CPE + XL" AA m = 0, 
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où au moins un des nombres a&!, ..., &«” n’est pas nul. Puisque 
— 
A o4; = À; — An, cette relation se récrit sous la forme 


LA +atAi +... + &"An = 0. (25.8) 

OÙ A7 =D EE jui QT Le 
a at+ .,.,. + a" —= 0. (25.9) 
On voit facilement que tous les nombres a?, &!, . .., &«” ne peuvent 
être nuls. Choisissons parmi les nombres | œ°/A0 |, | œt/At |, ... 


.. | YA" | le plus grand ; on peut toujours considérer (en chan- 
geant, le cas échéant, la numération des points 4A,, ..., À») que 
le plus grand sera le nombre| &"/X”7| 














AU am œ am ami am 
0 |< Le SE SRE , er | (25.10) 
Il est évident que le nombre @&* n’est pas nul (autrement, d’après 
(25.10), tous les nombres @°, œ&!, ..., «”" seraient alors nuls). 
Nous pouvons toujours supposer que a” — À? (il suffit pour cela 
de multiplier tous les nombres @°, œ!, ..., &" par A/a", ce qui 
ne contredit pas les relations 25.8), (25.9)). Alors (d'après (25.10)) 
o0 œl ami 
Æ|<1, |, . er (El. (25.11) 





Soustrayons maintenant la relation (25.8) de la relation (25.4). Nous 
avons 


C=NA+MAi+...HLATAn— (a A+ atA,+...+La"Am) = 
0 1 
= }9 (1 —+) A+ (1 —) Aie 


am-1 


Ham (1 — | Ami (25.12) 





D'après (25.11), tous les coefficients du deuxième membre sont non 
négatifs. Ensuite, d'après (25.3), (25.9), la somme de ces coefficients 
est égale à 1: 
à ea CA m- ami 
fi) en (te) am (1) 

= (AOL LE... HAT) — (at + at +... Hart) = 

= (+ ML... HA (at +at+...+a")=1—0=1. (25.13) 

Les relations (25.12) et (25.13) ont exactement la même forme 
que (25.3), (25.4), mais le nombre m a diminué de { par rapport 
à (25.3), (25.4). Si maintenant m — 1 = n, alors les relations obenues 


(i.e. (25.12), (25.13)) sont les relations cherchées sous la forme (25.1), 
(25.2). Si l'on a toujours m — 1 > n, alors le nombre m — 1 peut 
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être diminué encore une fois de 4, etc. Après un nombre fini d’itéra- 
tions, nous obtenons les relations (25.3), (25.4) sous la forme (25.1), 
(25.2). 

Exemple 25.2. Soit 4 un nombre quelconque entre 1 en n. 
Choisissons dans l’espace Æ" k + 1. points libres 4,, A4,, . .., Az 
(donc non situés dans aucun plan de dimension 4 — 1). L’enveloppe 
convexe de l’ensemble de ces points sera désignée par [A5, A1, . .. 

., A] et s’appellera simplexe de dimension k. D'après la définition 
de l'enveloppe convexe, le simplexe de dimension k# est un ensemble 
convexe. 

Le simplexe de dimension 1 est l’enveloppe convexe de deux points 
distincts, c’est donc un segment. Le simplexe de dimension 
2 est l’enveloppe convexe de trois points n’appartenant pas 
à une même droite, c'est donc un triangle. Le simplexe de 
dimension 3 est l’enveloppe convexe de quatre points non situés 
dans un même plan (de dimension 2), c'est doncun tétraèdre. 
Pour 4 > 3 le simplexe de dimension k est la généralisation multidi- 
mensionnelle du segment, du triangle, du tétraèdre. 

En vertu du théorème 25.1, le point C appartient au simplexe 
140, Au, . . ., A] si et seulement si 


C — À0A 5, + MA; +  . - NA, 
où les nombres N°, À, ..., A} satisfont aux relations 
N>0, M>0,..., A0, M+A+X+ ... LA =. 
Convenons d’appeler l’ensemble M de l’espace E" solide convexe 
si cet ensemble est convexe et contient au moins un point intérieur. 


Exemple 25.3. Tout simplexe de dimension n de l’espace E" 
est un solide convexe. 


En effet, choisissons dans le simplexe [4,, A,, ..., A,] un point 
quelconque € — A4, + MA,+ ... + A4, pour lequel tous les 
nombres À?, Al, ..., À” sont positifs: 


M>O0,M—>O0,..., "0, MEL... HAT = 1. (25.14) 


Soit e un nombre positif tel que 


ASE, NE; Leu Not (25.19) 
— 
—— 
Les vecteurs e, — 4541, . .., €, — A4, Sont linéairement indé- 


pendants (voir théorème 17.6) et forment une base de l'espace ET. 
Choisissons des nombres zx!, ..., x" qui satisfont aux relations 


je, rie: (25.16) 
n n 
Alors le point 
DSC ETeé;$ +: bare, (25.17) 
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appartient également au simplexe considéré. En effet, 


—_— — 
D= (MA; +AMA, +... LN74,)+ 24541 +... +2" A5AÀn = 
= MA, +AMA; +... +HNA4, +at (4, — À) + ... +2" (4, — À;) — 
= (A0— xt... —29 A++ at) A,+...+L(\ + x) À 
On voit directement que la somme des coefficients du deuxième mem- 
bre de cette relation est égale à 1 (voir (25.14)) et, d’après (25.15), 
(25.16), tous ces coefficients sont non négatifs. Le point D appartient 
donc au simplexe. 
Soit maintenant f,, ..., f, une base orthonormée de l’espace E7. 
Chaque vecteur jf; peut être représenté sous forme de combinaison 
linéaire des vecteurs e,, ..., €, : 


fi=uaie, + ...+aie,, i—1,...,n. 
Désignons par a le plus grand des nombres | a | de sorte que 
jai|<a, l, j=1,..., n, 
et posons r — e/(n?a). Démontrons que la boule de rayon r et 
de centre au point € est entièrement contenue dans le simplexe 
[As, Au, . .., A], ce qui signifie justement que ce simplexe est 
un solide convexe. 
En effet, soit D un point quelconque de cette boule, i.e. 
p (C, D) <Lr. Alors, 
— D 
CD=yÿ fit... HV fn: 
où (y)? + ... + (y? = (op (C, D)}  Lr? et donc 
IT IS TS 


Nous avons maintenant 


CD=pfi+ +" fav (ae rates) + 
+ y(ale; +...+aen)+...+y" (are + ...+aner) — 
= (ay +... any") ei +... +(aiyt +... any") en = 
— x'e;+...—+zx'e,, 


a aiyt+ ...+Laiy. 
Il est clair que 
ÉRESCAIPREUEEE 


Ainsi, le point D satisfait aux relations (25.16), (25.17) et appartient 
donc au simplexe [4,, 4À,, ..., A,]. Nous voyons, par conséquent, 


€ 
n e 
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que la boule de rayon r et de centre C est entièrement contenue dans 
le simplexe considéré. 

Théorème 25.4. Tout ensemble convexe de l’espace E”" est 
soit un solide convexe, soit un sous-ensemble d’un certain plan de dimen- 
sion injérieure à n. 

Démonstration. Soit M un ensemble convexe de £7. 
Fixons dans M] un point À, et considérons tous les vecteurs de la for- 


—> 
me À,4, où le point À parcourt MW. 
Choisissons dans cet ensemble de vecteurs un nombre maximal de 


— — 
vecteurs linéairement indépendants 4,4,, ..., A,4,. Il y a deux 
possibilités: k — n ou k < n. Considérons-les séparément. 

Si k — n, il découle de l’indépendance linéaire des vecteurs 


— — 
A 041, : -., AoÀ, que les points 4,, ÀA,, ..., À, ne sont contenus 
dans aucun hyperplan et sont donc les sommets d’un simplexe de 
dimension n [A,, A1, ..., A,l. Puisque l’ensemble ] contient 
tous les points A,, À,, ..., À,, il contient également l’enveloppe 
convexe de ces points, i.e. le simplexe [4,, A,, ..., A,]. Mais, com- 


me nous savons, le simplexe de dimension n est un solide convexe et 
contient donc des points intérieurs. A fortiori l’ensemble M contient 
des points intérieurs, c’est donc un solide convexe. 

Supposons maintenant # < n. Prenons un point quelconque C € M. 


—> — — 
Alors les vecteurs A04,, -.., A4», AC sont linéairement 
dépendants (leur nombre étant plus grand que k) et, par conséquent, 


> 
d’après le théorème 13.3, le vecteur À,C s'exprime linéairement en 
ET — 
termes des vecteurs À,4,, ..., AA: 
———> ——> —— 
AC — at AA: + . + a" AA, 
i.e. le point C est situé dans le plan P de dimension k passant par le 


— — 

point À,, dont les vecteurs 4,4,, ..., ÀA,A4, forment une base. 
Ceci étant vrai pour tout point C € M, on voit que tout l’ensemble 
M est contenu dans le plan P de dimension #. 

Le plan P construit pour les nécessités de la démonstration du 
théorème 25.4 (dans le cas À << n) possède des propriétés importantes. 

Ce sera le plan de dimension minimale contenant l’ensemble 1. 
En effet, puisque l’ensemble 7 contient les points A,, À, ..., A», 


— — 
et les vecteurs 4,4,, ..., ÀA,4, sont linéairement indépendants, on 
en déduit que les points As, Az, . . ., A, sont libres et donc ces 
points (et a fortiori l’ensemble 1) ne peuvent pas se disposer dans un 
plan de dimension inférieure à . 
Nous voyons ensuite que le plan P se détermine de manière unique 
par l’ensemble convexe M : c’est le plan de dimension minimale qui 
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contient M. En effet, s’il existait deux plans différents de dimension 
k contenant 7, alors l’ensemble 7 serait contenu dans leur intersec- 
tion, donc dans un plan de plus petite dimension, ce qui est impos- 
sible. 

Enfin, remarquons que si l’on considère le plan P comme étant un 
espace euclidien de dimension k, l’ensemble 17, relativement à cet es- 
pace, sera un solide convexe, i.e. M contient des points intérieurs 
relativement à l’espace P. En effet, l'enveloppe convexe des points 
A, Az, ..., À, est un simplexe de dimension k [A,, A,, ..., An] 


Ê 


Fig. 65 


dans l’espace P de dimension k et contient, par conséquent, des 
points intérieurs dans P ; a fortiori l’ensemble M contient également 
des points intérieurs dans l’espace P?. 

Nous dirons dans ce cas que le plan 2 (fig. 65) supporte l’ensem- 
ble convexe Â] (qui n’est pas un solide convexe dans E”). Si 
l’ensemble M est un solide convexe de l’espace £”, convenons de dire 
que le plan qui le supporte est l’espace tout entier Æ£”. En résumant 
tout ce que nous venons de dire, nous obtenons la proposition sui- 
vante. 

Corollaire25.5. Pour tout ensemble convexe M de l’espace 
E", il existe un plan unique de dimension minimale contenant M. On 
dit que ce plan supporte l’ensemble convexe M. L'ensemble M est un 
solide convexe de l’espace E”, si, et seulement si, il est supporté par un 
plan qui coincide avec l’espace E". Chaque ensemble convexe est un corps 
convexe relativement au plan qui le supporte. 

Pour conclure, introduisons encore une définition: un ensemble 
convexe sera dit de dimension k s’il est supporté par un plan de di- 
mension . 

26. Frontière d’un corps convexe. Théorème 26.1. L'adhé- 


rence M d'un ensemble convexe M est également un ensemble convexe. 

Démonstration. Soient À et B deux points quelconques 
de l’ensemble À. Démontrons que le segment |A, B] est alors entiè- 
rement contenu dans M, i.e. chaque point 


C=(—AhA+AB, où 0LA1< 1, 
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appartient à l’ensemble M. Pour cela, il faudra établir que chaque 
boule de centre C a des points communs avec l’ensemble W. 


Considérons la boule de rayon r et de centre C. Comme À € M, 
la boule de rayon r et de centre À a des points communs avec l’ensem- 
ble M, il y a donc un point 4, € M tel que o (4, A4,) < r. De la 
même manière, on peut trouver un point B, € M tel queo (B, B;) < 
< r. Soit le point 


CG =U4 0) A Le NB. 


Alors C; € [A,, B,l, et donc, d’après la convexité de l’ensemble M, 
le point C, appartient à A. D'autre part, 


CCC) A+AB-U-1A—IB= 
— — 
(42) (4—24)+A(B,—B)=(1—1) AA, + ABB, 


D'où nous obtenons (prenant en considération que les nombres 
À et 1 — À sont non négatifs): 


p (C, Ci =|CCil=|(1—AÀ) AA +ABB,|< 
—> — — 
<|(1— 2) A4|+[ABB;|=(1—2)]A4;]+ 
HA] BBl= (13) p (4 An)+hp(B, B)<U—Mr+hr=r. 


Ainsi, nous avons trouvé un point C, € M tel queo (C, C;)<r, 
en démontrant que la boule de rayon r et de centre C a des points 
communs avec M. Le théorème est démontré. 

Par la suite, nous ne considérerons que des ensembles convexes 
fermés, i.e. nous conviendrons de considérer (sauf mention con- 
traire) que chaque ensemble convexe considéré contient tous ses points 
frontières. Remarquons en particulier que tout polyèdre convexe est 
(d’après sa définition) un ensemble fermé. 

Soit M un ensemble convexe de l’espace £”. L’ensemble de tous 
ses points intérieurs sera noté int M et s’appellera intérieur de l’en- 
semble M. L'ensemble de tous les points frontières de l’ensemble 
M sera noté fr M et s’appellera frontière de l’ensemble A (fig. 66; 
n — 2). D’après l’indication si-dessus, nous pouvons admettre (si 
le contraire n’est pas indiqué) que fr ME M, ïi.e. M = (int M)l 
U (fr M). 

Remarquons que si l’ensemble convexe M n’est pas un solide con- 
vexe (c’est-à-dire qu’il ne contient aucun point intérieur), alors tous 
ses points sont des points frontières, et dans ce cas l’ensemble convexe 
M coïncide avec sa frontière. Autrement dit, l’étude des propriétés 
de la frontière et des points frontières n’a de sens que pour les cas du 
solide convexe. D'ailleurs, chaque ensemble convexe de l’espace ET 
est un solide convexe relativement au plan qui le supporte. On peut 
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donc parler de l’intérieur et de la frontière de l’ensemble 7 relative- 
ment au plan qui le supporte (fig. 67; n — 3); nous les désignerons 
respectivement par relint M et relfr M. Prenant ces faits en considé- 
ration, nous nous limiterons dans ce paragraphe à l’étude de la fron- 
tière d’un solide convexe. 

Théorème 26.2. Si À et B sont des points intérieurs du solide 
convexe M, alors chaque point du segment |A, B]est également un point 


| l 


Irééreur 


1 


fronéière 


_s 
e 









































Fig. 66 


intérieur de ce solide. Si À est un point frontière et BP un point intérieur 

du solide convexe M, alors chaque point du demi-intervalle (A, BÏ] est 

un point intérieur de ce solide. Enfin, si À et B sont des points frontiè- 

res de l’ensemble convexe M, alors tous les points de l'intervalle (A, B) 

sont des points intérieurs de ce 

solide, ou bien tous les points 

de cet intervalle sont des points 
reifr_ÎT frontières du solide M. 

LL Démonstration. 

CL Soient À et B des points 

CL intérieurs du solide 

convexe M. Alors la boule 

d'un certain rayon r, et de 

centre À est entièrement con- 

Fig. 67 tenue dans 7 et la boule d’un 

certain rayon r, et de centre 

B est entièrement contenue dans M. Notons r le plus petit des 

nombres positifs r,, r,. Alors le solide 7 contient des boules de 

rayon r et de centres À et B respectivement. Démontrons que si C 

est un point quelconque du segment [4, B], alors la boule de rayon 

r et de centre C est entièrement contenue dans M (fig. 68). 
Nous avons 





C = (1 — À) À + AB, 


0LA1<1. 
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— 
Soit C, un point de la boule de rayon r et de centre C, ïi.e. [CG | < 
a > 
< r. Soient maintenant À, et B, des points tels que AA, = BB; — 
= 


— — 
— CC.;. Alors, | AA, | = |CC; | r, ie. le point À, appartient 
à la boule de rayon r et de centre À. Mais cette boule est entièrement 











e UR 
AN 
KE) 





Fig. 68 Fig. 69 


contenue dans M et le point À, appartient donc à M. Exactement 
de la même manière B, appartient à M. D'autre part, 


ne — 
Ci=C+CC;=(1—2) A+AB+CC;— 
=> —— 
—({—à) A+AB+(1— A) CC; +ACC, — 
=> — 
—({—1)4+AB+(1— A) 44, ABB, — 


—(1—3)(4+ AA) +A(B+ BB;)=(1— 2) A+ AB. 


La relation obtenue signifie que le point C;, appartient au seg- 
ment [4,, Bil (car 0 LÀ 1). Mais si les deux points À,, B, 
appartiennent à M, et celui-ci est convexe, tout le segment [A,, B.]l 
doit aussi lui appartenir. En particulier C, € M. Nous avons ainsi 
démontré que la boule de rayon r et de centre C est entièrement con- 
tenue dans M, i.e. C'est un point intérieur de celui-ci. Ce qui démon- 
tre la première partie du théorème. 

Démontrons la seconde. Soit À un point frontière et B 
un point intérieur du solide convexe M. Alors une boule d’un 
certain rayon r et de centre B est entièrement contenue dans le corps 
M. Soit maintenant C un point du demi-intervalle (4, B|: 


C=(t—1)A+AB, où OLA 1. 


Démontrons que la boule de rayon Àr et de centre C est entièrement 
contenue dans M (fig. 69). 
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—> 
Soit C, un point de cette boule, i.e. | CC, | < Ar. Désignons 
— — — 
par B, un point tel que BB, = (1/A)CC;. Alors | BB, | — 


—> 
— (1/À) |CC, | < r de sorte que le point B, appartient à la boule de 
rayon r et de centre B. Mais cette boule est entièrement contenue dans 
M et, par conséquent, le point B, appartient à M. D'autre part, 


Ton —> _ 
Ci=C+CC=C+A1BB=(1—2) A+AB+ABB, = 
—(1—3) A+A(B+ BB) =(1—2) A+ AB. 


La relation obtenue signifie que le point C;, appartient au segment 
[A, B,l. Mais puisque les deux points À, B, sont contenus dans M 


b 





Fig. 70 Fig. 71 


(rappelons que nous avons convenu de ne considérer que les ensembles 
convexes fermés, de sorte que chaque point frontière, en particulier 
_ le point À, appartient à M), donc tout le segment [4, B,] appartient 

à ce solide. En particulier, C, € M. Nous avons donc démontré que 
la boule de rayon Àr et de centre C est entièrement contenue dans 7, 
i.e. C est un point intérieur de M, ce qui démontre la deuxième par- 
tie du théorème. 

Soient, enfin, À et B des points frontières de M. Il est 
possible que tous les points du segment [4A, B] sont des points fron- 
tières de M (fig. 70). Mais s’il se trouve un point C € [A, B] qui 
s’avère intérieur dans M (fig. 71), on déduit d’après ce qui a déjà été 
démontré, que tous les points des demi-intervalles (4, C] et (B, C] 
sont des points intérieurs, et donc tous les points de l'intervalle 
(A, B) sont des points intérieurs dans M. 

Théorème 26.3. Soit Q un point intérieur du solide convexe 
M et l une demi-droite d’origine Q. Alors la demi-droite l appartient 
entièrement à M (fig. 72) ou bien a un seul point commun avec la fron- 
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tière de M (fig. 73), et dans ce dernier cas l'intersection de L'avec M est le 
segment [Q, Al. ' 

Démonstration. Supposons que la demi-droite Z n’est 
pas entièrement contenue dans le solide M. Alors il se trouve sur la 
demi-droite un point B qui n'appartient pas à M. Il est clair que si le 
point € se trouve sur la demi-droite Z au-delà du point B (i.e. 
BE IQ, CD, alors le point C ne peut appartenir à M (sinon tout le 
segment [Q, C] serait contenu dans M et le point B serait alors contenu 


1 If 4 

Il (Un LUTTE 
{ 7) | | L 
id ii 


dans M). Par conséquent, l'intersection / N] M est entièrement située 
sur le segment [Q, BI. Soit À le point le plus éloigné de Q dans 
l’ensemble / AN M (un tel point existe, puisque M est un ensemble 
fermé et, par conséquent, /{} M est un ensemble fermé). Alors 
IN MCIQ, AI. Mais puisque les deux points A, Q appartiennent 
à M,onalQ, A]c M et, par conséquent, [Q, A] A M. Ainsi, 
1N M = IQ, AÏ. Comme Q est un point intérieur du solide 4, il 
en découle, d’après le théorème 26.2, que tous les points du 
demi-intervalle [Q, A) sont les points intérieurs de M. 

Ïl est évident que À est un point frontière de M puisqu'il existe, 
aussi près de À que l’on veut, des points de M (par exemple, les points 
du demi-intervalle [Q, A)) ainsi que des points qui n’appartiennent 
pas à M (par exemple, des points du demi-intervalle (4, B1). 

Gorollaire 26.4. La droite qui passe par un point intérieur 
Q du solide convexe M coupe sa frontière en deux points au plus. Si 
le solide M est borné, alors cette droite coupe la frontière exactement en 
deux points. 

Corollaire 26.5. Un solide convexe borné coïncide avec l’en- 
veloppe convexe de sa frontière. 

En effet, soit M un solide convexe borné. Puisque fr ME M, 
on a aussi conv (fr M) M. Réciproquement, soit À un point de M. 
Si À est un point frontière de M, alors À € fr M et, par conséquent, 
À € conv (fr M). Si maintenant À est un point intérieur de A, alors 


208 ÉLÉMENTS DE LA THÉORIE DES ENSEMBLES CONVEXES [CH. III 


la droite qui passe par À coupe fr M en deux points B, C et l’on 
a A € [B, Cl; puisque [B, CIE conv (fr M), on a aussi bien, dans 
ce cas, À € conv (fr M). Ainsi, M€ conv (fr M). 

Remarquons que le corollaire 26.5 reste vrai pour un solide con- 
vexe M non borné, si toutefois il ne coïncide pas avec l’espace 
tout entier E7 ou avec un demi-espace; la démonstration dans ce cas 
s’avère un peu plus difficile. 

Pour conclure démontrons encore un théorème qui nous servira 
à la fin du chapitre. 

Théorème 26.6. Si les ensembles convexes M,, ..., M, 
possèdent la propriété 


(relint M,)N .../fN (relint M.) £ ©, 


alors le plan qui supporte les ensembles M,f\ ...f M, coïncide 
avec l'intersection des plans qui supportent les ensembles M,, ..., MW, 
et l’on a la relation 


relint (,N .../N M.) = (relint M,)N .../fN (relint M). 


Démonstration. Il suffit d'établir le théorème pour 
s — 2 (ensuite, il suffit d’une récurrence évidente). Ainsi, supposons 
donnés deux ensembles convexes M,, M, qui satisfont à la relation 


(relint M,) N (relint M,) = G. 


Les plans qui supportent les ensembles WM.,, M, seront notés respec- 
tivement P,, P,, et le plan qui supporte l’ensemble M = M, {NN M, 
sera noté P. 

Comme M, P,, M, P;,, on a MN M, P,fNP, et, par 
conséquent, PS P,f\ P,. D'autre part, si À E€ (relint M,) f| 
N\ (relint M), alors tous les points du plan P, suffisamment proches 
de À appartiennent à l’ensemble W,, et tous les points du plan P, 
suffisamment proches de À appartiennent à l’ensemble A,. Par 
conséquent, tous les points du plan P, N\ P, suffisamment proches 
du point À appartiennent à l’ensemble M = M,f\ M,. D'où l'on 
déduit, premièrement, que P,fN P,S P et donc P = P,f) P,, de 
sorte que le plan supportant l’ensemble M, N M, coïncide avec l’in- 
tersection des plans qui supportent les ensembles M, et M,. Deuxième- 
ment. il découle de ce que l’on vient de dire que À € relint M, i.e. 


(relint 47,) N (relint M,) € relint (NY, N M). 


Il ne reste qu’à démontrer l’inclusion inverse. Soit B un point de 
l'ensemble relint (7, N M.) et supposons toujours À € (relint 4Z7,) { 
N (relint M,). Alors À € M,fN M, et il existe donc un tel point 
CEM,N M, que B est un point intérieur du segment [4, CI]. 
Puisque [A, Cle M, et À € relint M,, on a B € relint M, (théorè- 
me 26.2). De même, B € relint W,. Aïnsi, 


relint (47, N MW.) (relint M.) N (relint M,). 


mn 
OS) 
Lu) 
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21. Polyèdre convexe. La définition d’un polyèdre convexe a été 
donnée ci-dessus (p. 194). Ici nous démontrerons quelques théorèmes 
éclaircissant la « structure » des polyèdres convexes. 

Théorème 27.1. La frontière d'un polyèdre convexe de dimen- 
sion n est la réunion d’un nombre fini de polyèdres de dimension n — 1, 





telle qu'aucun couple de polyèdres n'appartient à un même hyperplan. 
Ces polyèdres de dimension n — 1 s'appellent faces principales du poly- 
èdre de dimension n donnée. 

Démonstration. Soit M un certain polyèdre convexe de 
dimension n. Par définition, il peut être représenté sous la forme 


M = Il, N MAN IRl (27.1) 


où [T;, . .., Il, sont des demi-espaces de Æ7T. Convenons d’appeler le 
demi-espace IT; superflu dans la notation (27.1), si l’intersection de 
tous les autres demi-espaces coïncide avec M. Sur la fig. 74 (qui se 
rapporte au cas n — 2), les demi-plans IL, et Il, sont superflus, puis- 
que l'intersection de quatre demi-plans IT,, Il,, IL,, Il, donne déjà 
le polyèdre MW. 

Nous pouvons considérer que dans la notation (27.1) tous les 
emi-espaces superflus ont été éliminés, i.e. qu'aucun des demi- 
espaces IT, . .., Il, n’est superflu. Cela veut dire que pour chaque 
i = 1, ..., k on peut trouver un point À; qui n'appartient pas au 
demi-espace IT; (et, par conséquent, n’appartient pas au polyèdre 
D), mais appartient à chacun des autres demi-espaces. Choisissons 
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un tel point pour chaque à, i.e. trouvons des points À,, ..., Ag 
tels que A;4Il;, mais A;€II; pour iZÆj(i, j — 1, ..., k). 
Notons l'; l’'hyperplan qui détermine le demi-espace IT; et posons 


Fi=TNILNIL"N “es NI NII, 
F:=ILNPNIBfN Fee Nil-11N1I,, ... F = 
=ILNILAILN... NOT. 


Démontrons que les ensembles F,, F,, ...,F, sont justement 
les polyèdres de dimension n — 1 cherchés qui forment la frontière 
du polyèdre M. 

Soit C un point frontière quelconque du polyèdre M7. Alors C € M, 
de sorte que le point C appartient à chacun des demi-espaces II,, ... 

, Il (cf. (27.1)). Si le point C était un point intérieur 
de chacun des demi-espaces IT, . .., Il,, alors pour chaque i — 
— {, ..., À on aurait pu trouver un tel nombre r; > 0 que la boule 
de rayon r; et de centre C serait entièrement contenue dans le demi- 
espace IT;. Mais alors, en désignant par r le plus petit des nombres 
lys Toy + + TR NOUS aurions pu trouver que la boule de rayon r 
et de centre C'est contenue dans chacun des demi-espaces IL,, . .. 
..…, JL, c’est-à-dire qu’elle est contenue dans À, et, par conséquent, 
C'est un point intérieur du polyèdre M, ce qui contredit l’hy- 
pothèse. Ainsi, on peut trouver un tel i (au moins un) que le point 
C n’est pas un point intérieur du demi-espace II;, i.e. C € [';. Puis- 
que, d’autre part, le point C appartient à tous les autres demi- 
espaces (car on a CE M), alors CE F; et, par conséquent, C'€ 


€ F U U F,. Ainsi, chaque point frontière du solide M7 appar- 
tient à l'ensemble PEU ++ WPF 
Réciproquement, soit C 2 F; De . U F2. Alors, on peut trou- 


ver un tel nombre à (au moins un) que CE F; et, par conséquent, 
CE T;. Puisque C € M, C est soit un point intérieur, soit un point. 
frontière du polyèdre M. Mais le point C ne peut pas être un point 
intérieur, puisqu'il existe des points qui n’appartiennent pas au 
polyèdre 7 aussi près que l’on veut du point C € ['; (par exemple, des 
points situés du côté opposé de l’hyperplan l'; par rapport au demi- 
espace Il;). Par conséquent, C est un point frontière du solide A. 

Ainsi, 

fr M = F,{|] ss + U F. 

Démontrons maintenant que F; est un polyèdre de dimension 
n — À qui est supporté par le plan [;. Remarquons avant tout que 
l', =IT; N IL, où II* est le deuxième demi-espace (également fermé} 
déterminé par l’hyperplan l';. Nous pouvons donc écrire: 


F=(LNn..niNnl. 


Ainsi, #; est l’intersection d’un nombre fini de demi-espaces. 
D'autre part, l’ensemble F; est borné (car F,;, € M). Par conséquent, 
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F;, est un polyèdre convexe. Il est clair, de plus, que F;€ T;. Par 
conséquent, il ne reste qu’à démontrer que F; contient des points 
intérieurs relativement à l’hyperplan l';. 

Soit B un point intérieur quelconque du polyèdre M. Les points 
À; et B sont situés sur les côtés opposés de l’hyperplan [l'; (car A; € 
€ I, BEII, et aucun des points 4;, B n’est contenu dans l’hyper- 
plan l;), et donc le segment [4;, B] a des points communs avec cet 
hyperplan. Autrement dit, il existe un tel nombre À que0<A1<1 
et le point 


appartient à l’hyperplan l;. Désignons par r un tel nombre positif 
que la boule de rayon r et de centre B est entièrement contenue dans 
le polyèdre M. Démontrons que chaque point D de l’hyperplan [; 
situé à une distance de C inférieure ou égale à Àr appartient au po- 
lyèdre F;. 

En effet, soit D € l';, et o (C, D) < hr. Désignons par £ le point 


— — 
tel que BE — (1/À) CD. Alors 


de 1 1 
=7|CD|=+e(C, D)<--:-r=r, 





o(B, E)=|B£1—|{ D 


i.e. le point Æ appartient à la boule de rayon r et de centre B, et 
donc Æ € M. D'autre part, 


— — 
D=C+CD=U--2) A; LAB+NBE — 


= (1—))A;+A(B+BE)=(1—A) A;+AE, 


d'où l’on voit que D € [A; ET. Mais le point Æ appartient à tous les 
demi-espaces II,, ..., Il, (car £ € M), et le point À; appartient 
à tous ces demi-espaces, sauf IT;. Par conséquent, le segment [A,, El 
tout entier (et en particulier le point D) est contenu dans l’intersec- 
tion de tous les demi-espaces II,, . .., Il,, sauf II;. De plus, par 
construction, D € l';. Donc, 


DEILN.. NAN NIBuN... NT, 


i.e. D € F;. Ainsi, chaque point de l’hyperplan l'; situé à une distan- 
ce de C inférieure ou égale à Ar appartient au polyèdre F;. Ceci veut 
dire que F;, contient des points intérieurs relativement à l’hyperplan 
l'; i.e. F'; est un polyèdre de dimension n — 1 supporté par le plan [';: 
Pour terminer la démonstration, il reste à établir que les hyper- 
plans F,, ..., l, qui supportent les polyèdres F,, ...., F, sont 
distincts deux à deux. En effet, supposons que les hyperplans T'; et 
l'; coïncident. Alors le demi-espace Il; doit coïncider avec l’un des 
deux autres demi-espaces déterminés par l’hyperplan l';, c’est-à-dire 
avec l’un des demi-espaces IT;, IT*. Mais l'égalité Il; — IT; signifie que 
14% 
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l’un.des deux demi-espaces Il;, Il; est superflu (contrairement à l’hy- 
pothèse), tandis que l'égalité II; — IT* signifie que 


M =TE,/N ae NII OH,-IL NÉ -=T,, 


ce qui est également impossible puisque le polyèdre M est de dimen- 
sion nr. Tous les hyperplans l,, . .., l’, sont donc distincts. 

Le théorème démontré se rapporte en fait non seulement au po- 
lyèdre de dimension n, mais également au polyèdre de dimension 
quelconque. 

En effet, soit M un polyèdre de dimension r, où r < n. Le po- 
lyèdre M peut être représenté sous forme d’intersection d’un nombre 
fini de demi-espaces (de l’espace £): M = IL A ...fNI1,. No- 
tons P le plan qui supporte le polyèdre M. Puisque M€ P, on peut 
écrire 

M=Pf(L" ... A 1) = (Nn P)n .. 
sf OT E 2): (27.2) 


Considérons chacune des intersections Il; AN P (i — 1, ..., q). 
Cette intersection est non vide (car MCTII; A] P). Deux cas sont 
possibles: soit P est entièrement contenu dans le demi-espace Il; 
soit P n’est pas contenu entièrement dans Il;. Dans le premier cas, 
l'intersection IT; N P coïncide avec P et peut donc être éliminée (cf. 
(27.2)). Dans le deuxième cas (P n’est pas contenu dans Il;), l’inter- 
section IT; N P est alors un demi-espace de l’espace euclidien P. 
Ainsi, le polyèdre M peut être mis sous la forme 


M=I:n..….ni:, 


où Il;, . .., Il; sont des demi-espaces de l’espace euclidien P, i.e. M 
est un polyèdre de dimension r dans l’espace euclidien Æ" — P de 
dimension r. Mais dans ce cas, on peut directement appliquer le théo- 
rème 27.1 au polyèdre M, ce qui nous permet d’énoncer la proposition 
suivante: la frontière d’un polyèdre M de dimension r (relativement au 
plan qui le supporte) est la réunion d'un nombre fini de polyèdres de 
dimension r — 1 tels que deux d’entre eux ne peuvent être situés dans un 
même plan de dimension r — 1. Ces polyèdres de dimension r — 1 
s'appellent faces principales du polyèdre M de dimension r.. 

Nous pouvons maintenant décrire plus en détail la structure de la 
frontière d’un polyèdre. Soit M un certain polyèdre de dimension 
r de l’espace Æ£” (en particulier, on peut avoir r — n). Les faces prin- 
cipales de ce polyèdre s'appellent aussi faces de dimension r — 1. 
Chacune de ces faces (qui est un polyèdre de dimension r — 1) pos- 
sède à son tour des faces principales. Celles-ci sont également consi- 
dérées comme faces du polyèdre M donné (à savoir ses faces de dimen- 
sion r — 2). On définit d’une manière analogue les faces de dimension 
r — 3 du polyèdre M (comme faces principales de ses faces de dimen- 
sion r — 2), etc. 
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Ainsi, chaque polyèdre de dimension r possède des faces de di- 
mension r — 4,r — 2, ..., 4, 0. Les faces de dimension zéro d’un 
polyèdre sont appelées sommets (ce sont des points); les faces 
de dimension 1 d’un polyèdre s’appellent arêtes (ce sont des se g- 
ments). 

Par exemple, pour r = 1, i.e. pour le cas d’un polyèdre de dimen- 
sion À (un segment), il y a des faces de dimension nulle qui seront les 
sommets (ou les extrémités) du segment considéré. La fron- 
tière du polyèdre est composée 
de deux points (i.e. les extrémités du 
segment). Pour r=2, c’est-à-dire 
pour le cas du polyèdre convexe de 
dimension 2 (un polygone convexe; 
cf. fig. 65, a), il y a des faces de 
dimension 1: les arêtes (les 










côtés du polygone), et des faces de & 
dimension zéro: les som- 2e 
° = < XX 
mets du polygone. La frontière sera ne 
dans ce cas la ligne brisée nee 
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qui limite le polygone. Pour 
r—3, i.e. dans le cas du polyèdre 
convexe de dimension trois (fig. 79), 
il y a des faces de dimension 2 (des Fig. 79 

faces « usuelles »), des faces de 

dimension 1 (les arêtes) et les faces de dimension nulle (les sommets). 
La frontière sera la surface du polygone considéré. 

Théorème 27.2. Tout polyèdre convexe est l’enveloppe convexe 
de ses sommets. L'ensemble M est un polyèdre convexe si et seulement si 
M est l'enveloppe convexe d’un nombre fini de points. 

Démonstration. Démontrons la première partie du théo- 
rème par récurrence sur la dimension r du polyèdre considéré M. 
Pour r = 1, si M est un segment |A, B1], le polyèdre M possède deux 
sommets À, B et il est leur enveloppe convexe. Ainsi, pour r — 1, 
la première partie du théorème est vérifiée. 

Supposons démontrée la première partie du théorème pour r  m, 
et soit M un polyèdre de dimension m. Désignons par F,, ..., F, 
les faces principales du polyèdre 7, de sorte que fr M = F,{] ... 
... U F3, et par M l'enveloppe convexe de tous les sommets du 
polvèdre M. Il est évident que MY M (car l’ensemble convexe M 
contient tous les sommets, et donc leur enveloppe convexe). D'autre 
part, tout polyèdre F; (de dimension m — 1) est, d’après l'hypothèse 
de récurrence, l'enveloppe convexe de ses propres sommets. Donc, 
F;c M (car l’ensemble convexe M* contient tous les sommets du 
polyèdre M, et, en particulier, tous les sommets du polyèdre F,;). 
Ceci étant vrai pour chaque à — 4, ..., k, on a fr MC MY et, 
par conséquent, M contient aussi bien l’enveloppe convexe de l’en- 
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semble fr M, i.e. tout le polyèdre M (voir corollaire 26.5). Aïnsi, 
M*= M, et par conséquent M* — M, c’est-à-dire que M coïncide 
avec l'enveloppe convexe de ses sommets. La récurrence effectuée 
démontre ainsi la première partie du théorème. 

Comme chaque polyèdere possède un nombre fini de sommets, 
il découle de l’assertion démontrée que chaque polyèdre convexe peut 
être représenté comme l’enveloppe convexe d’un nombre fini de 
points. I] nous reste à démontrer la réciproque, c’est-à-dire que l’en- 
veloppe convexe de tout ensemble fini de points est un polyèdre con- 
vexe. 

Soient V = {4,, ..., ÀA,} un ensemble fini de points et M — 
— conv V son enveloppe convexe. Notons P le plan de dimension 
minimale contenant tous les points À,, ..., ÀA,. Puisque P est un 
ensemble convexe contenant les points À,, ..., Ay, P contient éga- 
lement l’enveloppe convexe de ces points, i.e. PZ M. En même 
temps, aucun plan de dimension plus petite ne peut contenir entière- 
ment l’ensemble M (car ce plan ne contient même pas tous les 
points À,, ..., À,). Par conséquent, P est le plan qui supporte l’en- 
semble convexe M. Notons r la dimension du plan P et démontrons 
que M est un polyèdre convexe dans l’espace euclidien £7 — P. 

Nous conviendrons d'appeler distingué (relativement à l’ensem- 
ble de points À,, ..., À;,) le demi-espace de l’espace euclidien P 
s’il possède les deux propriétés suivantes: 1) tous les points À,, . 
..., À, appartiennent au demi-espace IT; 2) ceux des points À,, . .. 
..., A, qui sont situés sur l’hyperplan déterminant le demi-espace 
IT, définissant de façon univoque cet hyperplan (i.e. ne sont pas tous 
situés sur un plan de dimension r — 2). On voit aisément qu’il n’exis- 
te qu'un nombre fini de demi-espaces distingués. En effet, un 
demi-espace distingué se détermine de manière univoque si l’on choi- 
sit ceux des points A1, ..., À, qui sont situés dans l’hyperplan dé- 
terminant ce demi-espace. Par conséquent, si nous faisons une liste 
de tous les sous-ensembles de l’ensemble {4;, ..., A1}, nous som- 
mes sûr de ne laisser échapper aucun demi-espace distingué (quoique 
un demi-espace distingué ne corresponde pas nécessairement à cha- 
que tel sous-ensemble). 


Soient Il, . .., IT, tous les sous-espaces distingués. Démontrons 
que 
M — Il, N . N IT.. 
En effet, puisque tout demi-espace Il; (à — 1, ..., s) contient tous 
les points A1, ..., As, l'intersection IL, N] . .. f\ Il, contient éga- 
lement tous ces points, et contient donc leur enveloppe convexe: 
IT, f . + N 15 es M. 


Démontrons l'inclusion inverse. Soit Q le point de l’espace P 
qui n'appartient pas au solide convexe M. Choisissons parmi les 


$ 6] ENSEMBLES CONVEXES 215 


points A4, ..., Az r — À points quelconques et considérons le plan 
de dimension minimale qui contient le point Q et les r — { points. 
La dimension de ce plan ne peut être supérieure à r — 1. Construi- 
sons tous ces plans en choisissant de différentes manières r — { points 
de l’ensemble {4;, ..., A} et notons les plans obtenus R,, . .., Rp. 
Considérons un point intérieur B du solide M, non situé dans un des 
plans R;, ..., R, (cf. exemple 22.10). Dans ce cas, aucun point de 
l'intervalle (Q, B) ne peut être situé dans aucun des plans R;, ... 
..., R) (si un certain point C E (Q, B) appartenait au plan R;, 
on aurait, puisque Q € R; l’inclusion de toute la droite QC dans le 
plan À;, et le point B serait donc contenu dans le plan ÀR;. La demi- 
droite BQ coupe la frontière du corps 7 en un point C (théorème 
26.3), mais ce point C appartient au segment ouvert (Q, B) car B€ 
int M, QÉM. 

Comme CE M (et l’on voit facilement que l'enveloppe convexe 
d’un nombre fini de points est un ensemble fermé) on peut, d’après 
le théorème 25.1, trouver r + 1 points parmi les points À,, ..., A} 
{notons-les A:, ..., A,+.) et des nombres À, ..., A1 tels que 


C=hMA,+ ... | AA: 
SR de LR CRU ee 


Si tous les nombres Al, ..., A7 étaient positifs, alors le point C 
serait un point intérieur du simplexe [A4,, ..., A,4,] (cf. 
exemple 25.3) et, par conséquent, un point intérieur du solide 7, 
ce qui contredit le choix du point C. Ainsi, au moins un des nombres 
M, ..., N'lest nul; pour préciser, supposons que À’*! — 0, de 
sorte que 


C= MA +... + NA. (27.3) 

1] est aisé de voir que tous les coefficients A1, . .., N” sont positifs. 

En effet, si l’on avait NW” — 0, alors le point C serait situé dans un 

plan qui contient les points 4,, ..., ÀA,-,, i.e. dans l’un des plans 
BR, .: .., R}, Ce qui est impossible, puisque C € (Q, B). 

Ainsi, les nombres À, ..., À” (dans (27.3) satisfont aux relations 

M>O0,..., NO, A+... HN =. (27.4) 


Il est clair que les points Q, 4,, ..., À, ne peuvent être contenus 
par un hyperplan de l’espace P (autrement le plan de dimension mi- 
nimale qui possède ces points représenterait un des plans À;, ... 
..., À}, contenant le point C). On peut conclure que les points 
A1, -.., À, déterminent d'une manière univoque un certain hyper- 
plan T de l’espace P. 

Notons II le demi-espace de l’espace P déterminé par l’hyperplan 
let contenant le point B (i.e. ne contenant pas le point Q). Montrons 
que tous les points 4;, ..., A, appartiennent au demi-espace II. 
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En effet, supposons qu’un point À; n’est pas contenu dans le 
demi-espace II. Il est évident que j > r (les points À,, ..., À; 
étant situés dans l’hyperplan l'€ IT). Puisque les points Q, 4:, ... 
..., À sont libres, on a 


A = p°Q + pli +... + p'A,, (27.5) 
où u+ut+ ... +u — 1; posons 
D=pQ+(u +... +n)c. (27.6) 


Alors 
—— 
AjD=D—A;=p(C—A;)+ ... +u(C— Ar) — 
PRE ——> 
= UA,C+ ... +uA,C. 
——— 
On déduit que le vecteur À ;D appartient au sous-espace directeur de 


l'hyperplan l'et donc le point D, de même que À;, n’appartient pas 
au demi-espace IT. Comme, d’après (27.6), on a 


ss 
D=pQ+({—n)C=C+uco, 
il en découle que u° > 0. Mais, d’après (27.5), nous obtenons 


U | ui Tr 
= ne 6 ai — — À; 
Considérons le point 
{ 1 r 
Ci=eQ + (1e) Ce (= A5 Ai. — Ar) + 


+(—e) (A+. NA) = A; + 


+(A(—e) SH) A+ +(NA-e—- 4) 4 (7.7) 


Puisque u, > 0, on voit d’après (27.4) que tous les coeïlicients du 
deuxième membre de l'égalité (27.7) seront positifs (pour un 
nombre e >> 0 suffisamment petit). Choisissons un nombre &e qui possède 
ces propriétés. Alors, d’après le théorème 25.1, le point C; appartient 
à l’ensemble 7. D'autre part, C; E (Q, C}, et donc C'E(C:, B). 
D'où l’on déduit (en faisant appel au théorème 26.2) que C est un 
point intérieur du solide M, contrairement à la construction. 





La contradiction obtenue nous montre que tous les points 4, . .., Az 
appartiennent au demi-espace II. 

Ainsi, le demi-espace II contient tous les points A1, ..., A7. 
En outre, l’hyperplan T' qui détermine le demi-espace II contient les 
points A1, ..., À, (non situés dans aucun plan de dimension r — 2), 


i.e. l'est déterminé de manière univoque par ceux des points A1, . .. 
..., À, qu'il contient. Autrement dit, IT est un demi-espace distin- 
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oué, c'est-à-dire que II est un des demi-espaces IT,, . .., Il;. Puis- 


que QÉIT, on a QE N ... NI. 
Ainsi, de QÉM il découle que QéIL NN. N IT;, donc 
IL N...fNl.,cM. Avec l'inclusion démontrée antérieurement, 


cela signifie que HN ...NII, =M, 
cela veut dire que M est un polyèdre 
convexe de l’espace euclidien P. 

Si maintenant r — n (i.e. P coïn- 
cide avec Æ”), il est donc déjà dé- 
montré que M est un polyèdre convexe. 
Mais sir << n, nous pouvons choisir 
de tels demi-espaces Ilf, . .., IIS de 
l’espace £" quelIl* N P — II; (i — 1,... 
..., $); en outre, on peut choisir 
de tels demi-espaces Ilf,,, ..., II», 
que: . rai fl «28 Ni — D: (car, 
d’après le théorème 20. 4, P peut être 
représenté sous forme d’intersection Fig. 76 
de plusieurs hyperplans, et chaque 
hyperplan, comme l'intersection de deux demi-espaces). On a alors 


M=ILN...NIL=(N2)n...N(ÉNP)— 
es NP es BEEN; 





dans ce cas M est également un polyèdre convexe de l’espace ET. 

En guise de complément au théorème 27.2, remarquons que si 
A1, ..., A, Sont des points quelconques de l’espace Æ" et M l’en- 
veloppe convexe de ces points, alors les sommets du polyèdre 
M ne peuvent être que des points choisis parmi les points À,, . .. 

, A1, mais pas nécessairement tous ces points: certains d’entre 
eux peuvent être situés sur les faces ou à l’intérieur du polyèdre 
obtenu (fig. 76). 

La démonstration de ce fait s'obtient à l’aide de l’assertion sui- 
vante (qui nous donne la propriété caractéristique des sommets d’un 
polyèdre) : le point À du polyèdre M n'est pas son sommet si, et seule- 
ment si, il existe des points B, C € M tels que À € (B, C). Nous omet- 
tons la démonstration. 

Exemple 27.3. Soit [Ao, A1, ..., A,] un simplexe de di- 
mension # dans £”. Notons l'; l’hyperplan contenant tous les points 
A0, A1, - .., An Sauf À; (i — 0, 1, ..., n) et Il; le demi-espace 
déterminé par l’'hyperplan l'; et contenant le point A;. D'après la 
démonstration du théorème 27.2, il est clair que Il,, Il, . .., II, 
sont des demi-espaces distingués (relativement à l’ensemble des 
points A9; À, - - ., A) et donc 


Eds ds sr AT ed: . (LTÉE 
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Ainsi (comparer à la démonstration du théorème 27.1), les faces 
principales du simplexe [A,, A1, ..., A,] sont les simplexes de 
dimension nr — 1 


[ Ai, A2) Poe An-1: A; |; [A4 A2; EE An-1; Al, AS. 
RP PE 


Ensuite, on peut trouver toutes les faces de dimension nr — 2 du 
simplexe [4,, A1, ..., A,] (comme faces principales des simplexes 
(27.8)), puis les faces de dimension nr — 3, etc. En définitive, nous 
arriverons à la proposition suivante. Chaque face du simplexe T — 
— [45, A1, ..., À,] est également un simplexe d'une certaine dimen- 
sion. À savoir, si l’on ne prend qu’une partie des points A5, A, - .. 
..., An l'enveloppe convexe de ces points (ï.e. le simplexe dont ils 
sont les sommets) sera une face du simplexe 7. De cette manière, 
on peut obtenir toutes les faces du simplexe 7 de sorte que cha- 
que face du polyèdre Test un simplexe, dont les sommets sont cer- 
tains points de l’ensemble {4,, A:, ..., A,}. En particulier, le 
simplexe T de dimension n possède n + 1 faces de dimension n — 1 (et 
chacune d’elles s'obtient si l’on prend tous les points A5, A, . .. 

., À, Sauf un seul; voir (27.8)). Les faces de dimension zéro (les 
sommets) du simplexe (A5, A1, . .., A,] sont les points A5, A1, . .. 
..., À, et eux seuls. Il est bien entendu que des assertions analogues 
sont valables pour un simplexe de dimension quelconque, puisque 
chaque simplexe [B,, B;, ..…, B,] de dimension k peut être considéré 
comme appartenant à un espace euclidien de dimension k: au plan 
qui le supporte. 


$ 7. Propriétés d'appui des ensembles convexes 


28. Cône d’appui. Comme l'application affine f: E£*— E® d'un 
espace euclidien dans un autre est continue (cf. théorème 22.5), 
on peut dire, d’après le théorème 22.6, que l’image f (M) d'un en- 
semble fermé borné M € E" sera également un ensemble fermé borné. 
Mais un ensemble fermé non borné peut être envoyé par une 
application affine sur un ensemble non fermé. Par exemple, l’ensem- 
ble fermé déterminé dans le plan (x, y) par les inégalités 


zy>1, x > 0 


(« l’intérieur » d’une des branches de l’hyperbole ; fig. 77) est envoyé 
par projection orthogonale sur l’axe des abscisses sur la demi-droite 
ouverte x > 0, donc sur un ensemble non fermé. 

Théorème 28.1. L'image jf (M) d’un ensemble convexe M 
 E*" par une application affine f: E" — ET est un ensemble convexe 
(qui peut être non fermé) de l’espace ET. Si M est borné, alors f (M) 
l’est aussi ; si M est fermé et borné, alors f (M) est également fermé et 
borné. 
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Démonstration. Soient À, et B, deux points quelcon- 
ques de l’ensemble f (4). Il existe alors des points À, B € M tels 
que A1 — f (A), B, = f (B). Soit maintenant C; un point quelcon- 


que du segment |[4;, B:l, i.e. 
C1 = (4 — À) A1 + AB, (28.1) 


où À est un nombre réel qui satisfait aux inégalités 0 < À < 1. Dé- 
signons par C le point de l’espace Æ” défini par l'égalité 


Ce) A LAir (28.2) 


Alors, CE [A, BI] et, par conséquent, vu la convexité de l’en- 
semble 47, le point C appartient à cet ensemble. Comme f (A) — À,, 
f(B) = B,, on déduit de (28.1), 
(28.2) (en faisant appel à la défi- 
nition de l’application affine), 
que f(C) — C1, et, par consé- 
quent, C1 E f (M). Ainsi, chaque 
point C, du segment [4:, PB] 
appartient à l’ensemble f (W), 
qui est donc convexe. 

Théorème 28.2. Soit M 
un ensemble quelconque de l'espace 
F7. A lors f (conv M) — 
-=conv f (M). (Ici nous supposons 
toujours que f:ÆE"—+ ET est 
une application affine.) 

Démonstration. Com- 
me f(conv M) est un ensemble 
convexe (théorème 28.1), qui contient f (W), on a f (conv M) > 
D conv f (M). 

Démontrons l'inclusion inverse. Soit D un point quelconque de 
l’ensemble f (conv M), i.e. D — f (C), où C E conv M. D'après le 





Fig. 77 


théorème 29.1, on peut trouver des points As, A1, . .., À, de l’en- 
semble M et des nombres À?, Al, . .., À" tels que 
CA; MASSE se PA. à 
20, AZO0,..., M0: At HAL ... La = dt. 


D'après le théorème 19.1 on a 
D = (C0) = à (o) + NT (A1) +... + À7f (An). 


Mais si tous les points f (45),f (A1), - .., f (A,) appartiennent à l’en- 
semble f (M), il en découle que D € conv f (M). Ainsi, chaque point 
D de l’ensemble f (conv A1) est contenu également dans l’ensemble 
conv j (M), i.e. f (conv M) conv f (M). 

Gorollaire 28.3. L'image d'un polyèdre convexe par une 
application affine est également un polyèdre convexe. 
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Ceci découle directement des théorèmes 28.2 et 27.2. 

En guise d'exemple, la fig. 78 représente l’image d’un parallé- 
lépipède de dimension 3 par l'application affine f: £° — E?. Les 
8 sommets du parallélépipède sont envoyés par cette application sur 
8 points du plan et le parallélépipède lui-même sur l’envelo p- 
pe convexe de ces8 points. La figure représente également les 
segments sur lesquels s'appliquent les arêtes du parallélépipède. 

Définition 28.4. L'ensemble M de l’espace £" s'appelle 
cône de sommet au point Q, si l’ensemble 7 contient, pour chaque 
point À € M différent de Q, toute la demi-droite d'origine Q 
qui passe par À. Si l’ensemble M est convexe, tout en étant 
un Cône de sommet ©, on 
l’appelle cône convexe (de Ssom- 
met Q). Si l’ensemble 7 est 
en outre fermé, on l'appelle 
cône convexe fermé. 

Exemple 28.5. Soit 
P& E" un demi-espace fermé, 
T l’hyperplan qui le détermine 
et Q 4 l'. Alors P est un cône 
convexe de sommet (. 

En effet, la convexité de 
l’ensemble P a déjà été éta- 
blie (p. 190). Démontrons que 
P est un cône de sommet 
Q. Soit n un vecteur non 
nul, orthogonal à l’hyperplan T et dirigé vers le demi-espace P. 


— 
Alors, pour tout point À € P (distinct de Q), on a la relation n QA > 
> 0. Si maintenant C est un point de la demi-droite !, d’origine 


— — — 
Q et passant par À, on a QC —X QA, où À > 0 et donc n QC — 


— — 

— n (104) = À (n QA) > 0, i.e. C E P. Ainsi, la demi-droite L 

appartient entièrement au demi-espace P, c’est-à-dire que P est un 
cône de sommet (Q. 

Exemple 28.6. Soit / une demi-droite de Æ£” d’origine Q. 

Notons X l’ensemble de tous les points À € E" tels que le vecteur 





Fig. 78 


= 
QA forme avec la demi-droite ! un angle inférieur ou égal à , où 
0  p< x/2. Montrons que X est un cône convexe de £" au som- 
met ©. 

En eïtet, désignons par a le vecteur directeur de la demi-droite 
l'et posons: À — cos p (de sorte que À > 0). Le point À appartient 


— 
à l’ensemble Æ si et seulement si les vecteurs a et QA forment un an- 


— — 
gle inférieur ou égal à , i. e. si a QA > À | a || Q4 |. Soit A, BE 
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€ K tels que les relations 
aQÂ>Alal|QA], aQB>A|a||CË| 


sont remplies. Alors, pour des nombres quelconques & > 0, 8 > 0, 
nous avons 


a (aQA + BOB) = a (aQ A +8 (aQB) > 
>ailal|QA|+BAlal|QB|=Ala||aQA|+A|a||BQË|— 
_\ja|(|aQA|+IBQB|)>A|al| «04 + BOB) 


—> 
{cf. (16.3)). Cela signifie que le point C déterminé par l'égalité QC — 
—> —> 


= aQA + BOB appartient à l’ensemble À (quels que soient & > 0, 
6 > 0). Par conséquent, ÆX est un cône convexe de sommet Q. 

Remarquons que dans l’espace à trois dimensions l’ensemble 
K décrit dans l'exemple 28.6 est un cône de révolution d’axe Z et 
d'angle P (entre l’axe et la génératrice). 

Théorème 28.7. Soit M un cône convexe de sommet au point 
Q, et soient A1, . . ., Ax des points du cône M et h!, , À? des nom- 
bres non négatifs. Alors le point 


—> — 
A=Q+MQA;+ ... +AQA; 


appartient également au cône M. Si l’on a M > 0, À; étant un point 
intérieur du cône M, alors À est un point intérieur du cône ue 


Démonstration. Le point Bi = Q + Hé QAi Der 
tient à la demi-droite O4; et appartient donc au cône M (i = 1,. 
..…, %). Par conséquent, d’après la convexité, l’ensemble A7 con- 
tient également (cf. théorème 25.1) le point 


{ BP 1 1 10 À ! I RO À 
+ Bit... + Bi (Q+HAMQA)+ ... + (0 +41 04,) = 
—> AS 
= Q+MQA:+...+A2 OA, = À 


Supposons maintenant que À, est un point intérieur du cône con- 
vexe M] et À! >> 0 (en supposant que l’on a toujours 4,, . .., Ax € 
EM et °>0, , M >>0). Si À, = Q, alors M coïncide avec 
E* et tous les points de l’ensemble A7 sont des points intérieurs. 
Si 41 Æ Q, alors tous les points de la demi-droite Q4,, sauf Q, sont 
également des points intérieurs du solide 7 (théorème 26.2). 


+ 
En particulier, le point B, — Q + kA! OA, est un point intérieur. 
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De la relation 


1 1 1 
A=+ Br b;+...+z B:= 


on déduit que À est un point intérieur du segment aux extrémités 

BP, et C — — Ba + ... + — B, € M et, par conséquent, 

d’après le théorème 26.2, À 

est un point intérieur du 

a) ) solide M. Le théorème est 
démontré. 

On vérifie aisément que, 

7 c/ _ sur la droite (pour n — 1), 

7, = les cônes convexes sont les 

7 suivants: la droite, la de- 

F mi-droite et le point. Sur le 

gJ.S plan (pour n — 2) les cônes 

7 convexes ne sont que les 


ensembles suivants: le 

LÉ point, la demi-droite, la 
droite, l’angle inférieur ou 

LE 1 égal à x, le demi-plan, le 


plan entier (fig. 79). Dans 
l’espace de plus grande 
Fig. 79 dimension (même pour 
n — 3) les cônes convexes 
peuvent posséder une « structure » bien plus compliquée. Si, par 
exemple, M est un ensemble convexe quelconque situé dans un 
hyperplan l de l’espace E7, et 
Q un point non contenu dans cet 
hyperplan, alors toutes les demi- 
droites d’origine Q qui passent 
par les points de l’ensemble 17 
remplissent un cône convexe de 
sommet au point Q (fig. 80). 
Théorème 28.8. Soit 
M ET un cône convexe de 
sommet Qetf: E"— ET une ap- 
plication affine. Alors f (M) est 
un cône convexe de sommet f(Q). 
Démonstration. Soil Fig. 80 
M un cône convexe de sommet 
Q situé dans l’espace Æ”. D'après le théorème 28.1, l’ensemble f (M) 
est convexe. Démontrons que c’est un cône de sommet Q, = f (Q). 
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Soit À, un point quelconque de l’ensemble f (47), distinct du 
point @. Puisque 4, € f (M), il existe un tel point À € M que 
f (4) = À. Il est clair que le point À est distinct de Q (puisque 
A,  Q, on a f (A)  f (Q)). Soit maintenant C; un point de la 
demi-droite d’origine Q, qui passe par le point A,. Alors, d'après 
la définition de la demi-droite, on a C1 = ÀA;3 + (1 — À) Q:, où 
À > 0. Désignons par C le point de l’espace Æ” tel que C — A + 
+ (4 — À) Q. Alors 


f (C) = Àf (4) + (1 — À) j (Q) = AA: + (1 — 2) Q1 = Ci. 


Par conséquent, CE f (M), c’est-à-dire que toute la demi-droite 
d'origine Q, et passant par À, est contenue dans l’ensemble f(M). 





Fig. 81 


Exemple 28.9. Considérons dans l’espace à trois dimensions 
E* aux coordonnées x, y, z l’ensemble M déterminé par les inéga- 
lités 


+ypÿ—z<L0, z>0. (28.3) 


Cet ensemble est un cône convexe fermé de Æ°, au sommet à l’origine 
des coordonnées. Il est formé par toutes les demi-droites issues de 
l’origine des coordonnées formant avec le demi-axe positif z un angle 
inférieur ou égal à x/4 ; c’est donc (cf. exemple 28.6) un cône de ré- 
volution à angle x/4 entre l’axe et la génératrice (fig. 81). 

La demi-droite issue de l’origine des coordonnées et passant par 
le point À (0, 1, 1) est une des génératrices du cône M. Considérons 
la projection f de l’espace Æ* sur le plan Æ? des coordonnées x, y, 
parallèle à cette génératrice. Ce sera une application affine détermi- 
née par la correspondance 


(x, VE z) — (x, y — 2) 
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(c'est-à-dire qui envoie le point (x, y, z) de l’espace Æ* dans le point 
(x', y') du plan Æ? qui a les coordonnées 2° = x, y — y — 2). 
On déduit facilement de (28.3) que, pour chaque point (x, y, 2) 
du cône M, on a l'inégalité y < z et, par conséquent, l’image f (M) 
du cône M par l’application affine considérée est entièrement située 
dans le demi-plan déterminé dans £? par l'inégalité y < 0. 

.On voit aisément que tous les points du demi-plan ouvert 


« 


y < 0 appartiennent à l’ensemble f (M) (par exemple, le point 
(2. D : S + h) qui appartient, Comme on le voit, au cône A, 
sera envoyé dans le point (x,, yo) du plan Æ? tel que y, — —kh, où 
h >> 0). En même temps, sur la droite y — 0 qui est la frontière du 
demi-plan considéré, il n’y a aucun point de l’ensemble f (4), sauf 
l’origine des coordonnées (en effet, le point (x, O0) est l’image par 
l'application f des points de la forme (x, —h, h), or ce point n’appar- 
tient au cône M que pour x = 0). Aïnsi, l’ensemble f (47) contient 
tous les points du plan x, y qui possèdent une coordonnée négative 
y et aussi l’origine des coordonnées (cf. fig. 81). L'ensemble f (M) 
est (en accord avec le théorème 28.8) un cône convexe, mais ce cône 
n’est pas fermé. 

Cet exemple nous montre que l’image d’un cône convexe fermé 
par une application affine peut être un cône convexe non fer mé. 

En considérant la fig. 79, on voit que pour chaque cône convexe 
M de sommet Q dans le plan, on a l’une des deux possibilités: ou 
bien le cône A coïncide avec le plan tout entier, ou bien il existe une 
droite qui passe par le point ©, telle que le cône M est entièrement 
situé dans un des deux demi-plans (fermés) séparés par cette droite. 
Comme on voit d’après le théorème suivant, une situation analogue 
est observée dans les espaces de plus grande dimension. 

Théorème 28.10. Soit MC ET un cône convexe de sommet Q. 
Si M ne coïncide pas avec lout l'espace E", il existe alors dans E" un 
tel hyperplan TV qui contient le point Q, que le cône M est entière- 
ment situé dans un des deux demi-espaces (fermés), déterminés par 
l'hyperplan T. (Dans ce théorème, le cône convexe }7 peut être non 
fermé.) 

Démonstration. Raisonnons par récurrence sur la di- 
mension = de l’espace Æ£” qui contient le cône AZ. Supposons que pour 
les espaces euclidiens de dimension inférieure à n le théorème est 
vérifié et considérons un cône convexe M de sommet Q situé dans l’es- 
pace £" et ne se confondant pas avec celui-ci. Il existe alors un point 
À € E* qui n'appartient pas au cône M. Si Le cône M est de dimension 
inférieure à #, il est alors entièrement contenu dans un hyperplan 
et donc dans chacun des deux demi-espaces fermés, déterminés par 
cet hyperplan, donc, le théorème est vérifié dans ce cas. Nous pou- 
vons supposer que le cône West un solide convexe de £”, c'est-à- 
dire qu’il contient des points intérieurs. 
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Soit B un point intérieur du cône M non situé sur la droite AQ 
(fig. 82). (Remarquons que la droite AQ peut couper l’intérieur du 
cône M.) Puisque la demi-droite BA n'appartient pas entièrement 
au cône M (en effet, À & M), elle doit contenir un point frontière 
C du cône M (qui peut coïncider avec À si le cône M n'est pas fermé). 





Fig. 82 Fig. 83 


Remarquons que le point C ne peut pas coïncider avec Q, car dans 
ce cas le point B serait contenu par la droite AQ. 

Choisissons sur la droite AB un point D situé au-delà de À, i.e. 
tel que À E (D, B), et considérons la droite L qui passe par D paral- 
lèlement à QC. Démontrons que la droite / ne contient aucun point 
du cône M. En effet, supposons que la droite / contient le point 
E € M. Tous les points Q, B, C, À, D, E, sont dans un même plan 
P de dimension 2 (théorème 19.13), les points B et D étant situés 
dans ce plan de part et d'autre de la droite QC, puisque le segment 
BD coupe cette droite (fig. 83). Lorsque DE || QC, les points D et Æ 
sont du même côté de la droite QC (théorème 20.9). Les points B et 
E sont donc de part et d'autre de la droite QC, i.e. le segment BE 
coupe la droite QC dans un certain point F. Puisque £ € M et B 
est un point intérieur du solide 7, le point F est également un point 
intérieur de ce solide (théorème 26.2). Tous les points de la demi- 
droite QF (sauf Q) sont donc également des points intérieurs du solide 
M (théorème 26.3). Le point C (de la droite QF) n'étant pas intérieur, 
il ne peut pas appartenir à la demi-droite QF et appartient donc à la 
demi-droite opposée issue du point Q. Autrement dit, QE (C, F). 
Mais alors Q est un point intérieur du solide A] (théorème 26.2), 
ce qui est impossible. La contradiction obtenue nous montre que la 
droite / n’a pas de points communs avec le cône M. 

Soit maintenant l'un hyperplan quelconque qui coupe la droite Z 
(par exemple, un hyperplan orthogonal à la droite /). Désignons par 
x la projection de l’espace Æ£° sur l’hyperplan [' parallèlement à la 


15—01208 
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droite Z. Cette projection est une application affine de l’espace 
E" sur l’espace euclidien [ de dimension n — 1. Par conséquent, 
l’image x (M) du cône M par cette projection sera également un cer- 
tain cône de sommet Q, = x (Q). Il est clair que toute droite paral- 
lèle à Z est envoyée par l’applicationxenun point de l’espace T. En 
particulier, la droite Z est envoyée par l’application x en un point 
D; ET. Ensuite, le point À de l’hyperplan [' appartient au cône 
nr (M) si et seulement si la droite parallèle à ! qui passe par le point 
K coupe le cône M. Mais, étant donné que la droite Z elle-même n’a 
pas de points communs avec M (voir la démonstration ci-dessus), 
donc le point D, n'appartient pas au cône x (MW). Ainsi, le cône con- 
vexe x (M) de l’espace [' ne se confond pas avec l’espace tout entier. 

D'après l’hypothèse de récurrence, il existe, dans l’espace eucli- 
dien T' de dimension nr — 14, un hyperplan Z qui passe par le point 





Q, tel que tout le cône x (M) est situé dans un seul demi-espace IT* 
défini dans L' par l'hyperplan ZL. (Remarquons que Z est un plan de 
dimension nr — 2 dans l’espace Æ” considéré au début; fig. 84.) Tou- 
tes Les droites de l’espace Æ" parallèles à Z, qui passent par les points 
du plan Z, remplissent l’hyperplan l*—n-!(L1) de l’espace E7. 
De même que toutes les droites parallèles à Z qui passent par les 
points du demi-espace II* & T remplissent dans Æ” le demi-espace 
P* — n-!(II*) pour lequel l'* est l’hyperplan frontière (fig. 85). 
Puisque f (M) II, on a Me n-t(Il*) — P*. Ainsi, l’hyperplan 
T'* (qui passe évidemment par le point D) possède la propriété sui- 
vante: le cône 7 est entièrement situé d’un côté de ce demi-espace 
déterminé par l’hyperplan, et donc l’hyperplan T* est celui que l’on 
cherchait. 

Ainsi, si le théorème 28.10 est satisfait pour les cônes situés dans 
un espace euclidien de dimension n — 1, il est également valable 
pour les cônes de dimension n#. Mais pour nr — 2 le théorème est véri- 
fié, comme nous l’avons constaté plus haut : tous les cônes convexes 
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de l’espace de dimension 2 sont montrés fig. 79. (D'ailleurs, il est 
encore plus simple de commencer la récurrence par n = 1, et dans 
ce cas le théorème est tout à fait trivial.) 

Définition 28.11. Soit 7 un certain ensemble convexe de 
l’espace £" et Q son point frontière. Un hyperplan passant par le 
point Q s'appelle hkyperplan d'appui de l’ensemble M, si tout l’en- 
semble est entièrement situé dans un des deux demi-espaces (fer- 
més) résultant de la division par cet hyperplan de l’espace £”. 

Le théorème 28.10 peut maintenant être énoncé de la manière 
suivante: si le cône convexe M © E” ne coïncide pas avec tout l’espace 
E", alors un hyperplan d'appui de ce cône passe par son sommet. 

Il est intuitivement clair (en tout cas pour les ensembles convexes 
du plan et de l’espace à trois dimensions) que chaque point iron- 
tière d’un ensemble convexe possède un hyperplan d’appui de cet 


fi 


Fig. 86 


ensemble (fig. 86). Le théorème 28.12, démontré plus loin, nous mon- 
tre que notre intuition s’avère ici exacte. Signalons que nous pouvons 
admettre précisément l’existence d’au moins un hyperplan 
d'appui qui passe par le point frontière donné: il peut arriver que 
certains points frontières possèdent un ensemble infini d’hyperplans 
d'appui. 

Avant de passer à la démonstration du théorème 28.12, introdui- 
sons la notion de cône d’appuid'un solide convexe. Soit 
M un certain ensemble convexe et Q un de ses points. Considérons 
toutes les demi-droites issues du point Q et passant par au moins un 
point de l’ensemble M, différent de Q (fig. 87). Ces demi-droi- 
tes remplissent un certain cône À de sommet ©. | 

On voit facilement que le cône X est convexe. En effet, soient 
A et B deux points du cône X. Si l’un d'eux coïncide avec Q, il est 
alors évident que le segment [A, BÏ est contenu dans K. Si les deux 
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points À, B diffèrent de Q, alors 


> —> 
A=Q+n04,  B=Q+v0B 


Où A1, B1 € M et nu, v sont des nombres positifs. Soit C un point 
quelconque du segment [A, B1, .e. 


C=({—-?1A+AB, où 0L1<1 
Alors 


= > 
C=(1—2) (Q+uQ4;) +2 (0+v0B;)=— 
=O+(A—AutA D OA ER 0) 
=Q+((—2) + (RE 0 7 NIET )= 


OU 
.__  {{—Lu Av 
GER AT pue re 8.5) 


On voit de (28.5) que le point C; appartient au segment [4,, B.l et 
donc à l’ensemble convexe M. Si le point C, coïncide avec Q, d'après 
l'égalité (28.4), le point C 


? coïncide également avec OQ, 
EE 
PELLE, | en vertu de la définition du 
DSL cône Æ, toute la demi-droite 
LS LA issue de Q et passant par le 

/ GIE 
 INEGSLSL point C, est contenue dans 
” le cône XÆ, et, par consé- 
ÿ? quent, vu (28.4), le point C 
/ appartient au cône Æ. Aïnsi, 
/ “ dans tous les cas C € K, ï.e. 


le segment [A4,Blest entière- 
| ment contenu dans le cône 
Fig. 87 K. La convexité du cône X 

est donc démontrée. 
En général, il peut arriver que le cône X soit non fermé. L'’a- 
dhérence du cône À s'appelle cône d'appui de l’ensemble convexe M au 

point Q. 

Il est clair que le cône d’appui contient l’ensemble M en étant 
à son tour contenu dans le plan qui supporte l’ensemble convexe M. 
Il est clair également que si Q est un point intérieur del’en- 
semble M relativement au plan Z qui le supporte, alors le cône d’ap- 
pui de l’ensemble M au point Q coïncide avec tout le plan ZL. Mais si 
© est un point frontière de l’ensemble M relativement au plan 


$ 7] PROPRIÉTÉS D’APPUI DES ENSEMBLES CONVEXES 29% 


L qui le supporte, on voit aisément que le cône d'appui de l’ensemble 
M au point Q ne coïncide pas avec le plan L. 

En effet, soit À un point intérieur de l’ensemble M relativement 
au plan qui le supporte, et soit / une demi-droite issue du point ©, 
située sur la droite AQ et ne contenant pas le point À (fig. 88). Si 
un point B de la demi-droite Z différent de Q appartenait à l’ensemble 
M, alors, d’après le théorème 26.2, le point Q serait un point inté- 
rieur (relativement à L) de l’ensem- 
ble 17, ce qui contredit l’hypothèse. 
Par conséquent, aucun point 
de la demi-droite ! (autre que OQ), 
n'appartient à l’ensemble M et, 
par conséquent, la demi-droite 
l n’est pas contenue dans le cône X. 
Ainsi, le cône À ne peut coïnci- 
der avec le plan Z tout entier, et 
donc, d’après le théorème 28.10, 
le cône À est entièrement contenu 
dans un certain demi-espace de 
l'espace euclidien Z. Mais alors, Fig. 88 
l’adhérence du cône Æ (i.e. le cône 
d'appui de l’ensemble 7 au point Q) serait également contenue dans 
ce demi-espace, i.e. le cône d’appui ne coïncide pas avec tout le 
plan LZ. 

Ainsi, le cône d'appui d'un ensemble convexe M au point Q coïncide 
avec le plan qui supporte l’ensemble M si et seulement si Q est un point 
intérieur de l’ensemble M relativement au plan qui supporte M. 

Théorème 28.12. Chaque point frontière d’un ensemble con- 
vexe est contenu dans au moins un hyperplan d'appui de cet ensemble. 

Démonstration. Si l’ensemble convexe M E" n'est 
pas un solide convexe, il est alors entièrement situé dans un certain 
hyperplan l de l’espace Æ”. Il est évident que cet hyperplan est l’hy- 
perplan d'appui de l’ensemble M, puisque M est situé entièrement 
dans n'importe lequel des deux demi-espaces fermés déterminés 
par l’hyperplan ['. Dans ce cas, l’hyperplan d'appui contient tout 
point © de l’ensemble F7. Ainsi, dans le cas où M n’est pas un solide 
convexe, le théorème est trivialement valable. 

Soient maintenant M un solide convexe de l’ espace ET et Q un 
point frontière de M. Désignons par X* le cône d’appui de l’ensem- 
ble M au point Q. Le point Q est le sommet de ce cône. Puisque Q 
est un point frontière du corps M, on déduit des considérations ci- 
dessus que le cône X* ne coïncide pas avec tout l’espace £". D’après 
le théorème 28.10, il existe dans £” un tel hyperplan T contenant le 
point © que le cône ÆX* est entièrement contenu dans l’un des deux 
demi-espaces (fermés) déterminés par l’hyperplan [. Comme ÆX* = 
D M, ce même demi-espace contient entièrement le solide A7. Par 
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conséquent, [est un hyperplan d'appui de M. Par construction, on 
obtient l’hyperplan d'appui qui passe par le point Q. 

29. Fonctions affines sur un ensemble convexe. Soient M un en- 
semble convexe de l’espace Æ”, Q son point frontière et T l’hyperplan 
d'appui de l’ensemble M passant par le point Q. Le demi-espace (fer- 
mé) déterminé par l’hyperplan l' et contenant l’ensemble AZ sera noté 
P. Enfin, soit C un point non contenu dans le demi-espace P tel que 


= 

le vecteur n — QC est orthogonal à l’hyperplan T (fig. 89). Alors 
l’hyperplan T est formé de tous 

Ts les points 4 € ET pour lesquels on 


S 
a l'égalité nQA — 0, et le demi- 
espace P consiste en tous les points 
A € ET, pour lesquels on a l’inéga- 


LS 
lité nQA < 0. Mais si l’ensemble 
M est entièrement situé dans le 
demi-espace P, on a l'inégalité 


se 
nQA < 0 pour tout point À € M. 

Définissons ensuite dans l’es- 
P pace ET une fonction affine f en 


Les 

Fig. 89 posant f(A)— nQA. D'après les 

considérations ci-dessus, la fonc- 

tionfest non positive sur l’ensemble M et s’annule au point 

Q. Nous avons donc démontré le théorème suivant. 

Théorème 29.1. Soient M un ensemble convexe quelconque de 

l'espace E” et Q son point frontière. Il existe alors un tel vecteur n -£ 0 
que, pour chaque point À de l’ensemble M, on a la relation 


UN n 





+ 
nOAZ0. 


IT existe, d'autre part, une fonction affine non constante sur ET qui est 
non positive sur M et qui s'annule au point Q. 

Remarquons que la fonction f dont nous affirmons l'existence pos- 
sède un maximum au point Q (égal à 0), si l’on considère 
sa restriction à l’ensemble 4. 

Le théorème suivant est dans un certain sens la réciproque. 

Théorème 29.2. Soient M € E" un ensemble convexe et f une 
fonction affine non constante définie sur ET. Supposons que la restric- 
tion de la fonction f à l’ensemble M atteint son maximum en un certain 
point Q € M. Notons f, la fonction affine définie par l'égalité f, (A) — 
— f (A) — f (Q). Le noyau de la fonction f, est alors un hyperplan d’'ap- 
pui de l’ensemble M et passe par le point Q.Une assertion analogue est 
vérifiée pour le minimum de la restriction de f à M. 
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Démonstration. L'inégalité f, (4) < O0 définit un cer- 
tain demi-espace P de l’espace £" dont l’hyperplan frontière est le 
noyau de la fonction affine f,. D'autre part, puisque la restriction 
de la fonction f à M atteint au point Q son maximum, on a f (Q) > 
> f (A) pour tout point À € M. Autrement dit, f, (4) < 0 pour tout 
point À € M, i.e. l’ensemble M est 
entièrement contenu dans le demi- 
espace P. Mais cela veut justement 
dire que le noyau T° de la fonction 
affine ÿ, est un hyperplan d'appui 
de l’ensemble M] (puisque, évidem- 
ment, QE [). 

Corollaire 29.3 Une fonc- 
tion affine non constante restreinte 
à un solide convexe MC E" ne peut 
atteindre son maximum (ou son mini- 
mum) dans un point intérieur de M. ro 

En effet, si une telle fonction Fig. 90 
atteint son maximum au point Q € M, 
alors, d’après le théorème 29.2, un hyperplan d’appui du solide 
M passe par le point Q, qui ne peut donc être intérieur. 

Corollaire 29.4. Soient M ET" un ensemble convexe et 
l'un certain hyperplan. Il existe alors au plus deux hyperplans d'appui 
de l'ensemble M parallèles à T. Si M est un solide convexe borné, il y en 
aura exactement deux. 

En effet, soit f une fonction affine sur Æ£” dont le noyau coïncide 
avec l (voir théorème 20.2). Si la restriction à M de la fonction f 
n’a pas de maximum ni de minimum au point C € M, alors l’hyper- 
plan lc qui passe par C parallèlement à [ne peut être un hyperplan 
d'appui du solide M, puisqu'il existe dans M un point À pour lequel 
f (4) < f (C) et un point B pour lequel f (B) = f (C), de sorte que 
les points À et B de M sont de part et d’autre de l’hyprerplan le. 

Soit maintenant © le point où la fonction f, restreinte à MW, at- 
teint son maximum (si un tel point existe), et l', l'hyperplan qui le 
contient, parallèle à ['. Alors l', est un hyperplan d’appui de l’en- 
semble A7 d’après le théorème 29.2. (Remarquons que cet hyperplan 
contient tous les points où f atteint son maximum: ce seront les 
points de l’ensemble l', N 7 et eux seuls.) Des considérations analo- 
gues relativement au minimum peuvent nous donner un deuxième 
hyperplan d'appui. 

Pour un solide convexe M borné et fermé, la fonction f at- 
teint effectivement sur M] son maximum et son minimum qui sont 
différents entre eux ; par conséquent, il existe dans ce cas exactement 
deux hyperplans d'appui parallèles à F. 

Les fig. 90-92 nous montrent que pour les solides convexes non 
bornés le nombre des hyperplans d'appui parallèles à T' peut égaler 


NAIL 
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0, 1 ou 2. Si l’ensemble M est fermé et borné, sans êtreun solide 
convexe, le minimum et le maximum de la fonction f (considérée 
dans la démonstration) seront atteints sur Â] mais peuvent coin- 


Z 


Fig. 91 Fig. 92 


F' 
GG 


r 





cider. Un tel ensemble peut donc posséder soit un seul hyperplan 
d'appui parallèle à [' (si le plan qui supporte l’ensemble AZ est con- 
tenu dans l’hyperplan parallèle à L'; (fig. 98)), soit deux (fig. 94). 


L 


Fig. 93 Fig. 94 





Théorème 29.5. Soient MC FE" un ensemble fermé convexe 
et D un point qui ne lui appartient pas. Alors les assertions suivantes 
sont vérifiées : 

1) l’ensemble M possède exactement un seul point le plus proche de D}; 

2) il existe une fonction affine f sur E” non positive sur M et positive 
au point D ; 

3) ilexiste un hyperplan d'appui de l'ensemble M relativement 
auquel le point D est contenu dans un demi-espace ouvert et tout l’ensem- 
ble D dans l’autre demi-espace (fermé). 

Démonstration. D’après les considérations de l’exem- 
ple 22.11, il existe dans l’ensemble M le point B le plus pro- 
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che de D. Démontrons l’unicité du point B le plus proche. 

Supposons au contraire qu’il existe un point C € M différent de B 

pour lequel op (C, D) = p (B, D). Désignons par F le point déter- 
— — 


= 
miné par l'égalité DF — + DC + + DB. Nous avons alors 


= (p(C, D) (p(B, D}? =|DC [DE 
—>  —> 
=|DF+FCP—|DÉ+FBP-—(DF+FCR— (DE + FB} = 
—>  — —>  — —> — 
= (DF + FCÿ — (DF — FC} = ADF FC. 
—> — 
Ainsi, DFFC = 0, et 
IDÉP—IDÉ + FÈR— (DE + FC) —|DÉP+IFCE. 


ae 

Mais puisque BC, on a BC Z 0, et par conséquent FC — 

4 —= —> : —> — 
= BC =£ 0. Nous avons donc | FC |? >0,i.e [DC |? > | DF 
ou autrement p (C, D) > p (F, D). Nous voyons que le point F est 
plus proche du point D que C (ou B). En même temps, le 
point F appartient à l’ensemble M (car BE M,CEMetFEIB, CD, 
ce qui contredit le choix du point B. La contradiction obtenue dé- 
montre que le point de l’ensemble M le plus proche de D est unique. 
Ainsi, la première assertion du théorème est établie. 

Démontrons la seconde. Nous désignerons toujours par B le point 
de l’ensemble M le plus proche de D. Définissons la fonction f en po- 
sant 


—> —> 
f (4) = BD BA. 
Se 
La fonction f est alors une fonction affine à gradient n — BD (théo- 


—> —> —> 
rème 21.8), et l’on a f (B) = 0, f (D) = BD BD = | BD F > 0. 
I] nous reste à démontrer que la fonction f est non positive sur M. 


— — 
Soit AE Met A, E [A, B], i.e. BA, — ÀABA, où 0 << À < 1. Alors 
le point À, appartient également à l’ensemble M (celui-ci étant con- 
vexe), et par conséquent p (D, B) < p (D, A). Autrement dit, 


— — —>  — —>  — — — 
| BDP<]| DA, manie F—( (DB+ BA) = (DB +ABA}—- 

—> — — 

—(— BD+ABAÿ=| BDP—21BD BA+%|BAP, 


— 


—> — 
et t donc 2\BD BA < À ? | BÂ |? pour 0 << À < 1. On en déduit que. 
à > —> —> 
BDBA < < > BA |? pour 0<LÀ1<1, et donc BDBA < O0, i.e. 
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(4) < 0. La deuxième assertion du théorème est elle aussi démon- 
trée. 

La troisième assertion découle directement de la deuxième: le 
noyau de la fonction affine f construite est l’'hyperplan cherché. 

Corollaire 29.6: Chaque ensemble convexe fermé se met sous 
la forme d’intersection d'un nombre fini ou injini de demi-espaces. 

En effet, considérons tous les demi-espaces fermés qui con- 
tiennent l’ensemble convexe M et désignons par M* l'intersection de 
tous ces demi-espaces. Puisque chacun des demi-espaces consi- 
dérés contient M, on a M*= M. Démontrons l'inclusion inverse. 
Soit D é M. Alors d’après la troisième assertion du théorème 29.5, 
il existe un demi-espace fermé contenant M et n’admettant pas le 
point D. Donc, D & MY. Ainsi, si D É M, on a D 4 M*, i.e. 
M*< M. Ainsi, M — M*, donc M est l'intersection de tous les 
demi-espaces considérés. | | 

Théorème 29.7. Soit MC E" un polyèdre convexe et T son 
hyperplan d'appui. Alors l'intersection TN] M coïncide avec tout le 
polyèdre M, ou bien est une de ses faces. 

Démonstration. Effectuons une récurrence sur la di- 
mension r de l’espace E”. Pour n — 1 le théorème est trivial: les 
hyperplans dans l’espace euclidien Æ! de dimension 1 (i.e. sur la 
droite) sont des points, tandis que les polyèdres convexes de ET sont 
des points et des segments. 

Supposons le théorème démontré pour les espaces euclidiens de 
dimension inférieure à n, et soit M un polyèdre convexe de Æ”, et l 
un hyperplan d'appui de ce polyèdre. Désignons par m la dimension 
du polyèdre M. Alors deux cas sont possibles: m << n, m — n; nous 
les considérerons séparément. 

Soit m < n, et L le plan qui supporte le polyèdre M. Si l'hyper- 
plan l'contient le plan L, alors l'= M, et, par conséquent, LA M — 
— M, i.e. dans ce cas le théorème est valable. Mais si [ne contient 
pas entièrement le plan Z, alors l’intersection l'A Z est un certain 
hyperplan l'* de l’espace euclidien £" — Z. Dans ce cas, 


TANM=ITNCNM=TNLDNOM=ITNM, 


i.e. il faut considérer dans l’espace euclidien de dimension m l’inter- 
section l'* f] M du polyèdre M et de son hyperplan d'appui l'#. 
Lorsque m << n, on a, d’après l’hypothèse de récurrence, le fait sui- 
vant: cette intersection est une certaine face du polyèdre 7. Aïnsi, 
dans ce cas, le théorème est vérifié. 

Considérons enfin le cas m — n, où le polyèdre M est un soli- 
de convexe de l’espace £7. Il est clair que l’ensemble N = l'A M 
est un polyèdre convexe, puisque M est l’intersection d’un nombre 
fini de demi-espaces, et l l’intersection de deux demi-espaces (dé- 
terminés par cet hyperplan). Soit À un point intérieur du polyèdre 
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N relativement au plan Z qui le supporte. Mais si À € l'A 7, À 
est un point frontière du polyèdre M. D'après le théorème 27.1, 
il existe une face M, de dimension nr — 1 du polyèdre M contenant 
le point À. L’hyperplan qui supporte le polyèdre M, de dimension 
n — À sera noté l,. Démontrons que le polyèdre N est contenu dans 
l'hyperplan l.. 

En effet, soit B € N. Comme est un point intérieur du polyèdre 
N relativement au plan Z qui le supporte, on peut trouver un tel 
point CE N que À € (B, C}). Si le point B n’appartenait pas à l’hy- 
perplan T',, il en serait de même du point C, et alors les points B 
et C seraient situés de part et d'autre de l’hyperplan l'.. 
Par conséquent, un seul d’entre eux peut appartenirau polyèdre 
M (car celui-ci est entièrement contenu dans un des deux demi- 
espaces déterminés par l’hyperplan l,). Mais ceci est impossible, 
puisque les deux points appartiennent au polyèdre NE M. La con- 
tradiction obtenue montre que NE l,. 

Si maintenant les hyperplans let l', coïncident, alors N=rf 
ON M =T,N M = M,, i.e. N est une face du polyèdre HW. Il nous 
reste à considérer le cas où les hyperplans let [, ne coïncident pas. 
Dans ce cas [” = TA T, est un hyperplan de l’espace euclidien £7-1— 
= J', de dimension n — 1, et cet hyperplan sera un hyperplan d’ap- 
pui du polyèdre M, T,. Puisque NE T,. nous avons 


N=TNN=RNTOM)=(MNDAMNT)=T" NM. 


Ainsi, NV est l’intersection du polyèdre M, de dimension n — 1 et 
de son hyperplan d'appui l” (dans l’espace euclidien Æ"-1 = T, de 
dimension nr — 1). D’après l'hypothèse de récurrence, on en déduit 
que Ÿ est une face du polyèdre W,. Mais alors, par définition, N 
est également une face du polyèdre M. La récurrence effectuée démon- 
tre donc le théorème. 

On établit sans difficulté (en prolongeant ces raisonnements) 
que pour chaque face du polyèdre M il existe un hyperplan 
d'appui du polyèdre M qui coupe M justement en cette face. Si M 
est un polyèdre de dimension n dans Æ£”, et la face considérée 
est de dimension nr — 1, il existe alors un seul hyperplan d’ap- 
pui (à savoir le plan qui supporte cette face) qui coupe le polyèdre 
en cette face. Dans les autres cas il existe un nombre infini 
d'hyperplans d'appui dont l’intersection avec le polyèdre est la face 
considérée. 

Par exemple, si n — 2 et le polyèdre considéré est un p 0 1 y g o- 
ne convexe, alors (fig. 95) pour chaque face de dimension 
(arête), il existe exactement un seul hyperplan d'appui (dans le cas 
considéré une droite d’appui), et pour chaque face de dimension nul- 
le (sommet) un nombre infini de droites d'appui qui la contiennent. 
D'une manière analogue, dans le cas d’un polyèdre de dimension 
3 dans l’espace à trois dimensions (n — 3), chaque face de dimension 
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2 est contenue dans un seul plan d’appui, tandis que chaque arête 
à chaque sommet sont contenus dans un nombre infini de tels 
plans. 

Corollaire 29.8. Soit MC ET un polyèdre convexe et f 
une fonction affine sur E". À lors ou bien cette fonction f est constante sur 
M, ou bien l’ensemble de tous les points dans lesquels la restriction de cette 
Jonction au polyèdre M prend sa valeur maximale est une face du po- 
lyèdre M.En particulier, pour chaque fonction affine f,il existe un s o m- 
met du polyèdre M dans lequel la restriction de la fonction f à M 
atteint son maximum. On peut dire la même chose pour la plus petite 
valeur de la fonction f sur M. 

En effet, soit Q € M un point dans lequel la fonction f atteint 
son maximum sur M. Alors le noyau [de la fonction affine 1 définie 
par l'égalité f, (4) — f (A) — f (Q) est un hyperplan d'appui du poly- 

èdre M, passant par le point Q. 
Dans tous les points de l’hyper- 
plan l'(et dans ces {points seule- 
ment) la fonction f prend la valeur 
a f (Q). Par conséquent, l’ensemble 
de tous les points du polyèdre M 
dans lesquels la fonction f prend sur 
M sa valeur maximale coïncide 
avec M fN ['. Donc, d’après le théo- 
rème 29.7, on peut obtenir l’asser- 
tion cherchée. 

Théorème 29.9 Soient 
M & E" un polyèdre convexe et f une: 
fonction affine sur ET. Désignons par M la face du polyèdre M sur la- 
quelle la restriction de la fonction f à M prend sa valeur maximale. Pour 
que le sommet À du polyèdre M appartienne à la face M, il faut et il 
suffit que, pour chaque arête (A, B] du polyèdre M issue de A, on ait la 


Fig. 95 


relation n AB < 0, où n est le gradient de la fonction affine f. En par- 
ticulier, pour que f atteigne sur le polyèdre M son maximum seulement 
au sommet À, il faut et il suffit que, pour chaque arête (A, BI du po- 


——> 
lyèdre M issue de À, on ait la relationn AB < 0. 
Démonstration. Supposons que le sômmet À appartien- 
ne à la face M” et ee B] soit une arête issue du sommet À. Alors 


f{A4)>f(B),i.e.n AB < 0 (voir (21.5)). Si dans ce cas le ca 


B n’est pas sur la face M',on af (A) => f (B), al 
Ainsi, la nécessité des conditions énoncées est établie. 
Démontrons la suffisance. On peut supposer que la di- 
mension du polyèdre M n’est pas inférieure à 2, car autrement le 
théorème est évident. Soit À un sommet du polyèdre M, qui n’appar- 
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tient pas à la face M”. Choisissons un point quelconque C de la face 
M’, et soit D un point du polyèdre M non contenu par la droite AC 
(un tel point D existe, puisque, par hypothèse, la dimension du po- 
vèdre West inférieure ou égale à 2).Considérons le plan II de dimension 
12 qui passe par les points À, C, D et posons M* — II N M. Alors 
M* est un polyèdre de dimension 2 (i.e. un polygone convexe), pour 
lequel À est un sommet. Remarquons quela fonction f n’est pas cons- 
tante sur M*, puisque le point À 
n’est pas contenu dans la face M” et 
donc f (4) < f (C). 

Soient Æ et F des sommets du 
polyèdre M voisins de À. Si l’on 
avait les inégalités f(ÆE) < f (4), 
f(F) <f(4), alors, pour tous les 
points des demi-droites AE, AF, la 
fonction f prendrait des valeurs infé- 
rieures ou égales à f (A) et, par con- 
séquent, dans tous Îles points de 
l'angle formé par ces demi-droites, 
les valeurs de f ne pourraient être 
supérieures à f (A). Mais alors, dans 
tous les points du polygone M* Fig. 96 
(contenu dans cet angle; fig. 96), la 
valeur de f ne pourrait] être supérieure à f (A), ce qui est impos- 
sible, puisque f (C) > f (A). Ainsi, on doit avoir au moins une 
des inégalités j (£) > f (4), f (F) > f (A). 

Supposons pour préciser que f (Æ) > f (A). Considérons sur le 
côté [A, ET du polygone M* un point X. Le point K appartient au 
polygone M* et, par conséquent, au polyèdre M. Ce point est en 
même temps un point frontière de M (s'il était un point 
intérieur de W, il serait à la fois un point intérieur de M*). Par 
conséquent, d’après le théorème 27.1, on peut trouver une face 
M, de dimension m — 1 du polyèdre M contenant le point K, où 
m est la dimension du polyèdre M. Lorsque K € (A, E), tout le seg- 
ment [A, Æ] appartient à la face M,. Et alors, la restriction de la 
fonction ÿ à MW, n’atteint pas au point À sa valeur maximale, puis- 
que f (4)  f (Æ). Ainsi, si au sommet À € M la fonction f ne prend 
pas sa valeur maximale, on parvient à abaisser la dimension du po- 
lyèdre M de un (tout en laissant sans changement le fait que la fonc- 
tion jf ne prend pas sa valeur maximale au point À). 

En diminuant de cette manière la dimension des polyèdres, nous 
en viendrons à une face [A, B] de dimension 1 du polyèdre 
M, et la restriction de la fonction f à l’arête [A, B]l ne pourra tou- 
jours atteindre sa valeur maximale au point À, i.e. f (A)< f (B). 





Mais alors, n AB > 0. Ainsi, si le sommet À n'appartient pas à la 
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face M", il existe une arête [A, B], issue de ce sommet, telle que 


— 
n AB > 0. Ce qui démontre la suffisance des conditions énoncées 
dans le théorème. 


$ 8. Théorème de séparation des cônes convexes 


30. Séparation des ensembles convexes. Soient M, et M, deux en- 
sembles convexes de l’espace ET. Nous dirons que les ensembles M, 
et M, sont séparables dans £”, s’il existe un hyperplan l'E £” tel 
que l’ensemble , est situé dans un des demi-espaces déterminés 
par l’hyperplan T et l’ensemble M, dans l’autre. L’hyperplan T 





Fig. 97 Fig. 98 


qui possède cette propriété s'appelle kyperplan séparateur des ensem- 
bles M, et M, (ou hyperplan qui sépare les ensembles M, et M}. 

Soulignons que les ensembles M, et M, nesont pas nécessairement 
contenus dans les demi-espaces ouverts déterminés par l’hy- 
perplan l (comme sur la fig. 97); ils peuvent avoir des points com- 
muns avec l’hyperplan [qui les sépare (fig. 98). En particulier, si 
les ensembles M, et M, sont contenus dans un même hyperplan T 
(fig. 99), alors cet hyperplan sera séparateur pour 1, et M,. Remar- 
quons également que la séparabilité des ensembles dépend de manière 
essentielle du choix de l’espace euclidien dans lequel nous les 
considérons. Ainsi, M, et M, représentés fig. 99 sont sépara- 
bles si l’on les considère dans l’espace euclidien de dimen- 
sion 3, et inséparables, si l’onles considère dans l’espace 
euclidien de dimension 2. 

Le présent sous-paragraphe est consacré à l’étude de diverses 
conditions de séparabilité des ensembles convexes. Les ensembles 
convexes considérés seront toujours supposés fermés. 

L'étude de la séparabilité est particulièrement simple lorsque 
les ensembles convexes n’ont pas de points communs et au moins 
l’un d’entre eux est borné. Dans ce cas, les ensembles convexes sont 
toujours séparables. La construction la plus simple de l’hyperplan 
séparateur pour de tels ensembles est la suivante. 
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Soient M, et M, des ensembles convexes disjoints, l’ensemble M, 
étant borné. Pour chaque point À € M, trouvons dans l’ensemble M, 
le point Ble plus proche (théorème 29.5), et désignons par 
p (4) la longueur du segment [A, B]. Autrement dit, ® (4) est la 
plus courte distance de À aux points de l’ensemble M, 
(fig. 100). La fonction œ (À) est définie (et continue) sur l’ensemble 
W,. Il existe, par conséquent, un point À, dans lequel la restriction 
de cette fonction à M, atteint sa valeur minimale. En d’autres 





Fig. 99 Fig. 100 


termes, nous trouvons des points As € M, Bo € M3, qui réalisent 
le minimum de la distance entre les ensembles 7, et M,. (Remar- 
quons que le couple de points 4,, B, qui réalisent le minimum de la 
distance entre les points des ensembles M, et M, n’est pas néces- 
sairement unique; fig. 101.) Il suffit maintenant de construire un 
hyperplan L'orthogonal au segment [A,, B,l et passant par un point 
intérieur quelconque de ce segment; cet hyperplan sera justement 
un hyperplan séparateur (cf. fig. 100). 

En effet, si l’on pouvait trouver dans l’ensemble W, un point C, 
du côté opposé de l' par rapport au point À, (fig. 102), alors tout le 
segment [45, C] appartiendrait à l’ensemble M,. Mais alors des 
points du segment [4,, C] proches de À, seraient plus pro- 
ches de PB, que le point À, (puisque l’angle entre les segments 
[A5, Bol et Av, Clest aigu), ce qui contredit le choix des points 4,, 
B5- Par conséquent, l’ensemble M, est situé entièrement du même 
côté de [que le point A,. On démontre d’une manière analogue 
que l’ensemble 7, est situé du même côté de T que le point B,. 
Aïnsi, [est un hyperplan séparateur. 

Remarquons néanmoins que, dans le cas d’ensembles convexes 
disjoints M,, M, non bornés, ce raisonnement est inapplicable, puis- 
qu'il peut ne pas exister de distance minimale entreles points 
des ensembles 7, et M, (fig. 103). Plus loin, nous généraliserons 
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le résultat obtenu au cas des ensembles non bornés (voir corollaire 
30.8), mais la méthode de démonstration sera tout autre. Nous nous 
servirons de la proposition auxiliaire suivante, complémen- 
taire au théorème 25.1. 

Théorème 30.1. Soit F un ensemble fermé quelconque de 
l'espace E". Pour qu'un point C € E" soit un point intérieur de l’en- 
semble conv F, il faut et il suffit qu'il existe un entier positif m, des 


7 7/1 7, 
; LL 
7 \ 7 7 





7 7 
Fig. 101 Fig. 102 Fig. 103 
points Ag; As, +: : .» Am de l’ensemble F non contenus dans un seul 


hyperplan et des nombres N, À, ..., N°" tels que l’on ait les relations 


RSS 0, MO Les AT 0, AVAL sat ds B0:T 
CA, MAS sus EN. (30.2) 


Démonstration. Désignons par F* l’ensemble de tous 
les points C pour chacun desquels il existe un entier positif m, des 
points Ao, Au, ..., Am de l’ensemble F (non situés dans aucun 
hyperplan) et des nombres À?, Al, ..., A7 satisfaisant aux rela- 
tions (30.1), (30.2). L'ensemble F* est convexe (ci. la démonstration 
du théorème 25.1). Démontrons que c’est un ensemble ouvert. 

Soit C € F*, i.e. supposons vérifiées les relations (30.1) et (30.2). 
Puisque les points 45, A1, ..., An ne sont contenus dans aucun 
hyperplan, on am>n et on peut trouver, parmi les vecteurs 


— — 
A0Ày, ++. AoAm; # qui soient linéairement indépendanis. Sup- 
— 


posons, pour simplifier les notations, que les vecteurs A,54:, 


— 
., Ao4, Sont linéairement indépendants, de sorte que les points 


A, Az, + -., A, sont les sommets d’un simplexe de dimension n. 
Posons 


D= 04, AA, A ERA |. Am) A (30:8) 


Vu (30.1), le point D est un pointintérieur du simplexe [4,, 
Ay, «+, Anl (voir exemple 25.3) et, par conséquent, est un point 
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intérieur du polyèdre M qui est l’enveloppe convexe des points 4,, 
Ay, ++, Am. Il est également clair que tous les points intérieurs 
du simplexe [A,, A1, ..., A,l appartiennent à l’ensemble F*. 

Si D = C, alors C est un point intérieur de l’ensemble F*. Soit 
maintenant C D, de sorte que m > n (comparer aux relations 
(30.2) et (30.3)). Considérons le point 


ms 
E=C+EeDC, 


où & >> 0 (fig. 104). Il s'ensuit que le point C appartient à l’inter- 
valle (D, E). D'autre part, 


E=C+e(C—D)=(1+e)C—eD=(1+e) (N4,+ AA: +... 
ee RAT Am) —Ee (NA5—+ AA +... 
ee HAT Au HOT... HA) À4,) — 
— }0AHAAI+L ... LATVIA + 
He (ALL LA) AE (Le) AA 
... +(l+e) \7A4,. 


Il est évident que pour un e >> 0 suffisamment petit, tous les coef- 
ficients du deuxième membre sont positifs, et leur somme est 
égale à un, i.e. £ € F*. Aïnsi, les deux points D, E appartiennent à 
l’ensemble #*, et D est un point 
intérieur de cet ensemble. Puisque 
C'E(D, E), on en déduit, vu le théo- 
rème 26.2, que C est un point i n t é- 
rieur de l’ensemble F*. Nous 
voyons quetout point C de l’ensem- 
ble F* est son point intérieur, et 
donc l’ensemble F* est ouvert. 
Démontrons enfin que si l’ensem- 
ble F* est non vide, son adhérence 
coïncide avec l’enveloppe convexe de l’ensemble F. En effet, 
soit C, un point quelconque de l’ensemble conv F, de sorte que 


Ci = Bo + u*B: Fesses u*Bz, 


Où Bo; B1, - . ., B, Sont des points de l’ensemble F, et les nombres 
u, ul, ..., u# sont non négatifs et satisfont à la relation u° + 
+ut+...+u* = 1. On peut supposer (en se débarrassant, le 
cas échéant, des points superflus B;) que tous ces nombres sont 
positifs: 


u>0,u>0,..., pF=>0,u+ut+...ur = 1. 


Considérons un point C de l’ensemble F* (rappelons que cet ensem- 
ble est supposé non vide), i.e. un point qui satisfait aux relations 


E=e +: 





16-—-01208 
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(30.1) et (30.2), où As, A, . . ., Am ne sont contenus par aucun 
hyperplan. Soit ensuite À un point quelconque de l’intervalle ouvert 
(C, Ci); 1.e 


K=(1—v)C+x\C,, 0<v<t. 


Nous avons alors 
M (1 — v) (A4, + dt + A7A ») + v (u°B, + u!B; + ie 
. + UÀB;,) = (A — v) MA +... + (1 —v) AA, + 
+ vu9B, + vulB, +... + vuB;, 


les coefficients du deuxième membre étant positifs et de somme 


égale à 1. Puisque, par ailleurs, les points À4,, 41, . .., Am, Bo; 
B,, ..., B, ne sont contenus dans aucun hyperplan (car déjà les 
points A0, A3, -.. Am ne le sont pas), on a À € F*. Ainsi, chaque 


point K de l intervalle (C, C;) appartient à l’ensemble F*, de sorte 
qu’il existe des points de l’ensemble F* aussi proches de C, que l’on 
veut et, par conséquent, C. appartient à l’adhérence de F*. Autre- 
ment dit, l’ensemble conv F est entièrement contenu dans l’adhé- 
rence de l'ensemble F*, de sorte que l’ensemble conv F est fermé 
et contient F*, et donc conv F coïncide avec l’adhérence de 
l’ensemble F*. On déduit facilement : 


int (conv #) = F*. (30.4) 


En effet, si l’ensemble conv F ne contient pas de points intérieurs, 
i.e. l’ensemble # (et avec lui conv F) est entièrement contenu dans 
un certain hyperplan, alors F ne peut contenir des points 4,5, A1, ... 

.., Am non situés dans un seul hyperplan, el l’ensemble F* est 
donc vide. Ainsi, si l’ensemble int (conv F) est vide, alors F* l’est 
également, donc l'égalité (30.4) est satisfaite. 

Si maintenant l’ensemble int (conv F) est non vide, i.e. conv F 
contient des points intérieurs, alors F n'est contenu dans aucun hy- 
perplan, et contient donc des points À,, A,, ..., À, non situés 
dans aucun hyperplan, i.e. l’ensemble F* est également non vide. 
Dans ce cas F* est un ensemble ouvert convexe dont l’adhérence 
coïncide avec conv F et, par conséquent, l’égalité (30.4) est toujours 
valable. 

Ainsi, (30.1), (30.2) (où les points 4,5, 4A:, ..., Am ne sont 
contenus par aucun hyperplan) donnent une condition nécessaire 
et suffisante pour que le point C appartienne à l’ensemble int (conv F). 

Remarque 30.2. Contrairement au théorème 25.1, le théo- 
rème 30.1 n’affirme pas que le nombre m est égal à n dans les rela- 
tions (30.1), (30.2). Si, par exemple n — 2 et F est l’ensemble des 
quatre sommets du carré (fig. 105), le centre Q du carré est un point 
intérieur de l’ensemble conv F. En vertu du théorème 30.1, nous 


$ 8] THÉORÈME DE SÉPARATION DES CÔNES CONVEXES 243 


Q . À°A; + MA, + 24 » + 1° A 3, 


OU ANRT NT _. Il est néanmoins impossible de choisir 
0 


rois points non alignés pour lesquels on ait les relations (30.1), 
30.2). Ainsi, dans cetexemple, 
he DM 0 

Retournons maintenant à la 
question de la séparabilité des 
ensembles convexes. Considé- 
rons tout d’abord le problème 
de séparation de deux cônes 
convexes à sommet commun. 
Ce problème s’avère résolu 
par le théorème suivant. 

Théorè me 30.3. Soient 
M, et M; deux cônes con- 
vexes de l’espace ET possédant 





un sommet commun Q. Pour FN — 

que les cônes M, et M, soient AY 

séparables, il faut et il suffit 

qu'il existe des points B;, ... Fig. 105 

., BL du cône M, et des 

points Ci, Ca, + - ., Cr du cône M, tels que les points B;, . .., B3, 

C1, . .., Cu ne sont contenus par aucun hyperplan et tels que l’on a 
— —> — — 
QBi+... +OQBr=QCi+...+QCxr. (30.5) 


Démonstration. Désignons par NV, le cône symétrique 
au cône M, relativement au point Q (voir exemple 19.14), et posons 
F = N, | M. Si les cônes M, et M, sont séparés par l’hyperplan |, 
alors les deux cônes N,, M, sont situés dans un mê me demi- 
espace (fermé) déterminé par l’hyperplan F, i.e. l’ensemble F est 
entièrement contenu dans un demi-espace et, donc, son enveloppe 
convexe conv F est contenue dans ce même demi-espace. Autrement 
dit, Test un hyperplan d'appui de l’ensemble convexe conv F et, 
par conséquent, le point Q est un pointfrontière de l’ensemble 
conv F (puisqu'il est contenu dans l’hyperplan d'appui [ de l’en- 
semble conv F). Inversement, si Q est un point frontière de l’en- 
semble conv F, alors il est contenu dans un hyperplan d'appui F 
de l’ensemble conv F, et alors l’ensemble conv F et,par conséquent, 
les deux cônes N,, M, sont entièrement contenus dans un demi-es- 
pace déterminé par l’hyperplan [', de sorte que les cônes M, et M, 
sont séparés par cet hyperplan. 

Ainsi, les cônes M, et M, sont séparés si et seulement si Q est 
un point frontière de l’ensemble conv F. Les cônes sont donc i n - 


16* 
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séparables si et seulement si Q est un point intérieur 
de l’ensemble conv F. 

Supposons les cônes inséparables, i.e. soit Q un point intérieur 
de l’ensemble conv F. D'après le théorème 30.1, il existe des points 
A5 Ày, +. ., Am de l’ensemble F non contenus dans aucun hyper- 
plan, et des nombres A, À, ..., A7 qui satisfont aux conditions 
(30.1), (30.2) pour C == Q. Puisque F = N, |] M,, chacun des 
points A5, A1, ..., Am appartient au moins à un des cônes ,, 
M;. Supposons, pour préciser, que les points À,, À,, ..., Ag 
appartiennent au cône W,, où k < m, et les autres points Az, .. 

> Am au Cône W,. Posons maintenant ! — m — k + 2 et défi- 


nissons les points B:, ..., Bz, C1, . .., C1 par les relations 
— y —> 
OB;,— Lg. Gi=1,...,k); 
DA nikel . 
QC;=X QA ;+-1 (j = 1, #3 l—1) ; Ci=0Q. 
Il est alors clair que les points B,, ..., By appartiennent au cône 
M, et les points C,, . .., C1 au cône M,. Ensuite, les points B;,, . .. 
. Bps Cyr + + +, C1 ne Sont contenus dans aucun hyperplan (il 
contiendrait alors en même temps les points A,, A1, ..., Am). 


Enfin, on déduit de la relation (30.2) où € = Q 


= —  — — _" 
QBi+...+QB;=QCi+...+QCi1+ QC. 


Ainsi, la condition indiquée au théorème 30.3 est satisfaite, i.e. 
elle est une condition nécessaire. 

Démontrons la suffisance, i.e. supposons valable la condition 
indiquée au théorème 30.3, et montrons que les cônes M, et M; 
sont inséparables. Pour cela, supposons, au contraire, que les cônes 
sont séparables, i.e. qu'il existe un tel hyperplan [, qui passe par 
le point Q, que M, € P,, M, & P,, où P, et P, sont les demi- 
espaces fermés déterminés par l’hyperplan l'. Définissons le point D 
par les relations 


EE _ A _—. 
QD=QBi+...+OB,=QCi+...+Q0C. 


Puisque tous les points Q, B,, ..., B, appartiennent au demi- 
espace P,, le point Q étant contenu par l’hyperplan frontière, le 
point D sera également contenu dans ce demi-espace. D’une manière 
analogue, le point D appartient au demi-espace P,. Donc, D €T. 
Mais alors tous les points B,, ..., B, sont contenus dans l’hyper- 
plan l (autrement le point D serait situé dans un demi-espace ouvert 
et non sur l’hyperplan l) et, aussi, tous les points C,, ..., Ci 
sont-ils situés dans l’hyperplan l'. Mais ceci contredit le fait que 
tous les points B,, ..., B,, C;, ..., C1 ne sont contenus dans 
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aucun hyperplan. La contradiction obtenue montre que les cônes 
M, et M, sont inséparables. 

Le théorème suivant donne une condition nécessaire et suffisante 
d’inséparabilité de deux cônes de sommet commun sous une forme 
plus géométrique. 

Théorème 30.4. Soient M, et M, les cônes convexes de E” 
à sommet commun Q. Pour que ces cônes soient inséparables, il faut 
et il suffit que les deux conditions suivantes soient satisfaites : 

1) il n'existe pas d'hyperplan contenant les deux cônes M, et M; 

2) il existe un point À qui est un point intérieur de chacun des deux 
cônes M;, M, relativement au plan qui le supporte. 

Démonstration. Démontrons la suffisance des condi- 
tions énoncées. Supposons satisfaites les conditions 1) et 2) et admet- 
tons, au contraire, que les cônes M, et M, sont séparables ; soit 
l'hyperplan séparateur. Choïisissons un point quelconque B € M.. 
Puisque À est un point intérieur du cône M, relativement au plan 
qui le supporte, on peut trouver un point C € M, tel que A!E (B,C). 
Le point À appartenant au cône M,, il est contenu dans un dem- 
espace (fermé) déterminé par l’hyperplan T ; le point À appartenant 
également au cône M,, il doit être situé dans un autre demi-espace. 
Donc, 4 € T. Si le point B n'appartenait pas à l’hyperplan T', alors 
le point C n’y appartiendrait pas non plus, et les points B et C se- 
raient situés de part et d’autre de l'. Mais ceci est impossible, puis- 
que le cône W, est entièrement situé dans un demi-espace déterminé 
par l’hyperplan l. Donc, B ET, i.e. le cône M, est entièrement 
contenu dans l’hyperplan l'. On démontre d’une manière analogue 
que M, ET, mais ceci contredit la condition 1). La contradiction 
obtenue nous montre que les cônes sont inséparables si les condi- 
tions 1) et 2) sont vérifiées. 

Démontrons maintenant la nécessité, autrement dit, démontrons 
que si au moins une des conditions {), 2) n’est pas satisfaite, les 
cônes M, et M, sont séparables. Pour la condition 1.) c’est évident : 
si les cônes M, et M, sont situés dans un même hyperplan, ils sont 
séparables. Il reste à démontrer que les cônes M, et M, sont sépa- 
rables, si la condition 2) n’est pas remplie. 

Aïnsi, supposons qu'il n'existe pas de point À intérieur à cha- 
cun des cônes M,, M, (relativement au plan correspondant qui les 
sépare). Désignons par Z;, L, les plans qui supportent les cônes W,, 
M). Alors le point Q n'est pas un point intérieur (relativement au 
plan support) pour au moins un des cônes M,, M, i.e. qu’au moins 
un des deux cônes ne coïncide pas avec le plan qui le supporte. 
Supposons, pour préciser M, -£ L.. Considérons l’ensemble relint M, 
de tous les points intérieurs (relativement à Z.) du cône M,. Ajou- 
tant à cet ensemble le point Q, nous obtiendrons un cône convexe, 
qui sera noté M,. D'une manière analogue, en ajoutant à l’ensemble 
relint M, le point Q, nous obtenons un cône convexe M;. D'après 
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l'hypothèse, les cônes A7; et M, n’ont aucun point commun, sauf Q. 
D'autre part, M, L, (car M, © M,). Démontrons que les cônes 
M; et M? sont séparables (d'où l’on déduira facilement que les 
cônes M, et M, considérés au début étaient séparables). 

Supposons, au contraire, que les cônes M}, M; sont inséparables. 
Alors, d’après le théorème 30.3, il existe des points B,, ..., B, 
du cône M}; et des points C;, ..., C1 du cône M, tels que les points 
B,, ..., B3, C1, . .., Ci ne sont contenus dans aucun hyperplan, 
et la relation (30.5) est satisfaite. Définissons le point D par la 
relation 


QBi+... + QBe= Qt + QUr= QD. 


Comme Q est le sommet du cône M, et les points B,, . .., B, lui 
appartiennent, le point D appartient au cône M9. De même, le 
point D appartient au cône A,. Mais ces cônes possèdent un seul 
point commun Q. Par conséquent, D = Q, ï.e. 


— — — > 
OB:2..:0b;=00%-1: 40020: (30.6) 


Désignons par A, le polyèdre qui est l’enveloppe convexe des points 
B;, ..., B, et par NV, le polyèdre qui est l’enveloppe convexe des 
points C1, ..., C1. Les plans qui supportent ces deux polyèdres 
seront désignés respectivement par L* et ss La relation 


Q=+Bi+.. Pa Herr — B3, 


qui découle directement de (30.6), nous montre que le point Q ap- 
partient au plan L*,et en plus (vu le théorème30.1), est, dans l’es- 
pace euclidien L*, un point intérieur de l’enveloppe convexe 
des points B,, . .., B,, i.e. un point intérieur (relativement à L*) 
du polyèdre N,. Mais puisque W, € M; et M; est un cône de som- 
met Q, le plan Z* est entièrement contenu dans M,. On démontre 
d'une manière analogue que L? € M. On en déduit que les plans L? 
et L* possèdent un seul point commun Q. En même temps, ces deux 
plans ne peuvent être à la fois contenus dans un hyperplan (car un 
tel hyperplan contiendrait tous les points B,, .. » By, CRE 7 

Ainsi, les plans Z* et LS sont complémentaires, i.e. ils possèdent 
un seul point commun Q, et la somme de leurs dimensions est égale 
àn. D'où l’on conclut facilement que MW; — LŸ. Eneffet, soit À un 
point quelconque du cône M. Il existe des points B € L, CL” 

ss 


— —> 

tels que Q0A — QB + QC. Notons B, le point symétrique de B par 
— — 

LA DpOEE A Q. Il ot a HS B; SEE LŸ et OB, — —QB. Par consé- 


quent, QC — — QA — QB = = QA + OB.. Puisque À € M;,B, € M,, 
on en déduit que C € M. Ainsi, le point C apparitent à chacun des 
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—> — — 
deux cônes M°,",, et, donc, C — Q. De la relation QA — QB + QC, 


— — 
on déduit maintenant que QA — QB, ï.e. À — B, et donc AE I*. 
Ainsi, le cône AZ; coïncide avec le plan LŸ. Mais alors LŸ est le plan 
qui supporte le cône M, ï.e. M5 — LŸ — L;; mais ceci contredit 
l'hypothèse M,  L,. La contradiction obtenue nous montre que 
les cônes M}; et M, sont séparables. 

Ainsi, il existe un hyperplan FT tel que M, € P,, M € P;, où 
P,, P, sont les demi-espaces fermés déterminés par l’hyperplan FT. 
Ces demi-espaces étant fermés, P, contient, avec le cône A;, tous 
ses points frontières (relativement à ZL.), donc tout le cône }Z, est 
contenu dans P,. D'une manière analogue, M, € P,. Ainsi, T est 
un hyperplan séparateur pour les cônes M, et M. 

Corollaire 30.5. Soient M, et M, deux cônes convexes 
dans E”, à sommet commun Q, sans autres points communs. Alors, ou 
bien les cônes M,, M, sont séparables, ou bien M, et M, sont 
deux plans complémentaires (i.e. la somme de leurs dimensions est éga- 
le à n). 

Corollaire 30.6. Soient M, et M, des cônes convexes de E” 
à sommet commun Q, le cône M, étant solide (i.e. de dimension n), 
et le cône M, n'ayant pas de points communs avec l’intérieur de M. 
Alors les cônes M, et M, sont séparables. En particulier, deux cônes 
solides à sommet commun n'ayant pas de point intérieur commun sont 
séparables. 

Venons-en enfin à la considération du cas général. Soient M: 
el M, des ensembles convexes quelconques de l’espace Æ£”. Consi 
dérons l’espace euclidien £"**1 de dimension nr + 1, qui contient E, 
sous forme d’hyperplan, et soit Q un point de l’espace E"*1 non 
contenu dans £”. L'ensemble de toutes les demi-droites issues de Q 
et passant par les points de l’ensemble 47, forment un cône convexe 
de Æ"*1 que nous noterons X,. D'une manière analogue, les demi- 
droites issues de Q et passant par les points de l’ensemble 7, for- 
ment un cône convexe À, € E"*! (fig. 106). Supposons que T € £" 
est un hyperplan séparateur des ensembles 7, et M,. Alors l’hyper- 
plan l* de l’espace E"*! contenant let passant par le point Q sépare 
dans Æ"*1 les cônes X, et K,. Inversement, si les cônes X, et K, 
sont séparables dans Æ£"*! et l'* est l’hyperplan séparateur, il est 
évident que l’hyperplan l* n’est pas parallèle à l’hyperplan £” 
dans l’espace ÆE"*l el coupe donc cet hyperplan. L’intersection 
T* N E" est un hyperplan de l’espace E" et cet hyperplan sépare 
les ensembles }7, et M. 

À l’aide de cette méthode, le problème de la séparation des en- 
sembles convexes quelconques de Æ£” se réduit au problème de la 
séparation des cônes convexes à sommet commun dans Æ"*t. 
Par conséquent, on déduit des résultats 30.4-30.6 sur la séparation 
des cônes convexes obtenus ci-dessus les faits suivants (dans les- 
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quels les ensembles convexes M, et M, peuvent être aussi bien 
bornés que non bornés, fermés que non fermés). 

Corollaire 30.7. Pour que des ensembles convexes M, et 
M, de l’espace E” soient inséparables, il faut et il suffit que l’on ait 
les deux conditions suivantes: 

1) il n'existe pas d'hyperplan T' € E" qui contient les deux 
ensembles M, et M, : 

2) il existe un point À intérieur à chacun des ensembles M,, M, 
relativement aux plans qui les supportent. 





Fig. 106 


Corollaire 30.8. Tout couple d'ensembles convexes dis- 
joints (non vides) dans E" sont séparables. 

Corollaire 30.9. Soient M, un solide convexe de l’espace 
E" et M, © E" un ensemble convexe ne contenant pas de points inté- 
rieurs du corps M; alors M, et M, sont séparables. En particulier, 
deux solides convexes sans points intérieurs communs sont. séparables. 

Pour conclure, notons un lien très simple qui existe entre la 
séparabilité des ensembles convexes et les fonctions affines. Soit l 
un hyperplan séparateur des ensembles convexes M, et M,. Considé- 
rons une fonction affine non constante f dont le noyau est l’hyper- 
plan ll”. La fonction f est non négative sur un des demi-espaces déter- 
minés par l’hyperplan let non positive sur l’autre; elle est donc 
non négative sur un des ensembles 7, et M, et non positive sur 
l’autre. Ainsi, si les ensembles M,, M, sont séparables, il existe une 
fonction affine non constante, non négative sur un des ensembles M, 
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et M, et non positive sur l’autre. La réciproque est également évidente : 
si une telle fonction existe, les ensembles M,, M, sont séparables (le 
noyau de cette fonction sera l’hyperplan séparateur). 

Ainsi, le problème de la séparation des ensembles convexes est 
équivalent au problème de l’existence d’une fonction affine 
non constante, non négative sur un des ensembles et non positive 
sur l’autre. Ceci permet de reformuler les résultats 30.3-30.9 en. 
termes de fonctions affines. Par exemple, le corollaire 30.8 peut 
être énoncé de la manière suivante : si M,, M, sont des ensembles con- 
vexes disjoints non vides dans E”, il existe dans ET une fonction affine: 
non constante, non négative sur M, et non positive sur M3. 

31. Cône dual. Soit M un cône convexe de l’espace E” de som- 
met Q. Désignons par D (M) l’ensemble de tous les points B € E* 
qui possèdent la propriété suivante: pour chaque point À € M 


> — 
on a l'inégalité 04Q0B < 0. 
On voit facilement que l’ensemble D (M) est un cône de som- 
met Q. Soient B € D (M), À un nombre non négatif et B, un point 


— 
tel que QB;, — 1CE. Alors, pour chaque point À € M, nous avons 
—> — — — — — | 
QAQB:= QA (AQB)= 1 (QAQB)<O ie. BED (M). 
Il est aisé de voir que le cône D (M) est convexe. Soit B, € 
+ 
€ D (M), B, € D (M) et C un point du segment [B,, B,l, i.e. QC — 


—> — 
— ({—1)QB, +2X10B,, où 0O<A<'A. Alors, pour un point. 
quelconque À € M, nous avons 


QAQC— QA ((1— 2) QBi+AQB:) — 
= (1—2) 04 QBi+A0A OBS O, ie. CED(M). 


Remarquons enfin que le cône convexe D (M) est f er mé (même. 
si le cône donné M ne l'était pas). En effet, si le point E n’a p- 
partient pas au cône D (M),on peut trouver un point À € M 


—> — 
tel que QAQE < 0. Mais alors on aura également pour tout point Æ” 


— — 
suffisamment proche de Æ, l'inégalité 04 QE" > 0, i.e. E' 6 D (M). 
Par conséquent, le complément (dans l’espace Æ") de l’ensemble. 
D (M) est un ensemble ouvert et donc D (M) est un ensemble fermé. 

Ainsi, D (M) est un cône fermé convexe. On l’appelle cône dual 
de M (dans l’espace Æ”). 

Considérons en guise d'exemple l’espace £? de dimension 
deu x. Si le cône M coïncide avec tout le plan Æ? considéré comme. 
un cône de sommet ©, alors le cône D (M) consiste en un point Q. 
Si M est un demi-plan, D (M) est la demi-droite perpendiculaire à 
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la droite qui limite ce demi-plan (fig. 107). Si M est un angle infé- 
rieur à x, alors D (M) est un angle dont les côtés sont perpendicu- 
laires aux côtés de l’angle M (sila mesure de l’angle M est égale à «, 


DM) 


Fig. 107 Fig. 108 


alors celle de l’angle D (M) est égale à x — a ; fig. 108). Enfin, si M 
est une droite, alors D (M) est la droite perpendiculaire à M (fig. 109), 
et si M est une demi-droite, alors D (M) est un demi-plan (fig. 110). 


11; 


7) 1 DIM) 


( 12 1 
DM) 


Fig. 109 Fig. 110 


M 


Théorème 31.1. Soit M un cône convexe de sommet Q dans E”. 
Le point B appartient alors au cône dual D (M) si et seulement si la 
fonction affine f8 qui satisfait aux conditions 
Es 
fB(Q)=0, grad f2—0QB (31.1) 
est non positive sur M. 


$ 8] THÉORÈME DE SÉPARATION DES CÔNES CONVEXES 251 


Démonstration. Nous avons (pour tout point À € E"): 
— —> — 
fe (4)= f2 (4) —f(Q)=QA grad f5=QA0QB 


—> — 
{voir (21.5)), d’où il découle que B € D (M) (i.e. 0AQB < 0 pour 
tout point À € M) implique fg (A) < 0 pour tout point À € M, 
i.e. la fonction f8 est non positive sur M. Réciproquement, si la 
fonction f8 définie par les relations (31.1) est non positive sur MW, 
i. e. fs (4) L O0 pour tout point 


——— 
A EM, alors QAQB<O0O pour 
tout point AEM, et donc Kerf f 


BED. | W 0 
un . Pr . sr Be cg 7 H L 


met Q. Alors D (D (M))=M, i.e. 

le re dual au cône De D(M) grad# dl pD 

coïncide avec le cône donné M. ÿ 
Démonstration. Si 

A € M, alors pour tout point 

BED(M), on a l'inégalité 


—>——> 
OAOQB < 0, et, par conséquent, Ker 
M € D (D (M)). 

Supposons maintenant que 
C é M. Alors une boule Z d’un 
certain rayon r et de centre C n’a pas de point commun avec MW 
(rappelons que M est fermé). Puisque Z et M sont des ensembles 
convexes disjoints dans £", ils sont séparables (fig. 111), i.e. il 
existe une fonction affine non constante f, non positive sur M et 
non négative sur la boule Z. Définissons une fonction aîffine , en 
posant f, (D) = f (D) — f (Q) pour tout point D € E". La fonction }; 
est non constante. D'autre part, lorsque f (Q) < 0, on a f, (D) > f (D) 
et donc la fonction f,, de même que f, est non négative sur la boule 2. 
Montrons qu'elle est non positive sur le cône M. 

En effet, soit À un point distinct de Q du cône M et À un nombre 


Fig. 111 


— — 
réel. Désignons par À, le point déterminé par l’égalité 04, — À04. 
Alors À, € M et donc f (4,) < 0. D’après (21.5), nous avons 


f(A)—f(Q)=QA; grad f—AQÀ grad f—2(f (4) —j(Q)): 


Si f (4,) O0, on en déduit 
À (f (4) — f (Q)) < —f (Q). 
Cette relation est satisfaite pour tout À > 0, et donc f (4) — f(Q) < 


< 0. Autrement dit, f, (4) 0, ïi.e. la fonction f,est non posi- 
live sur M. 
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Ainsi, la fonction f, est non constante, non négative sur À, non 
positive sur M et satisfait à la condition jf, (Q) — 0. Comme la 
fonction est non négative sur la boule Z et non constante, le centre C 
de la boule Z n’appartient pas au noyau de la fonction f, (d’après le 


théorème 29.3), ï.e. f, (C) 0; par conséquent, f, (C) > 0. 
A 
Désignons par B un point tel que QB = grad f,. Alors, pour tout 
point À EM, on a 
—> —>  — 
QAQOB—OQA grad fi= fi (A) — fa (Q) = fi (4) 0. 
Et, donc, B € D (M). D'autre part, 


QB QC— QC grad f1= f1 (C) — fi (Q) = f1 (0) > 0. 


——— 
Ainsi, nous avons trouvé un point BE D (M) tel que QBQC > 0. 
D'après la définition du cône dual, cela veut dire que € é D (D (M)). 

Mais si CÉé M, alors C é D (D (M)), i.e. D (D (M)) & M. Avec 
l'inclusion déjà démontrée M & D (D (M)), ceci nous donne la 
relation D (D (M)) = M. 

Théorème 31.3. Soient M], ..., M}, des cônes convexes de 
sommet commun Q dans E", et soit M l'enveloppe convexe de l'ensemble 
M, UÙ ...U M,. Alors M est également un cône convexe de sommet.Q, 
et on a la relation 


DM) =D(M)N...ND(M). (31.2) 


Démonstration. Le fait que M est un cône convexe de 
sommet © est évident. Démontrons la relation (31.2). 

Soit BED (M,)N ...fN D (M}). Alors B € D (M;) pour tout 
ti — 1, ..., k, et, par conséquent, pour chaque point À; € M; on 


—— 
a la relation Q0BQA; < 0. Donc, pour chaque point À € M, ... 
—— 
... U M3, nous avons QBQA < 0. Mais alors, on aura également 


——— 
pour chaque point À € M la relation QBQA < 0 (voir théorème 25.1), 
et donc BE D (M). Ainsi, 


D (M.,)N ... D(M,)S D (M). (31.3) 
Démontrons l'inclusion inverse. Soit B € D (M), alors pour tout 
point À € M on a la relation QBQA 0. En particulier, pour tout 


—— 
point À; € M; on a l'inégalité O0BQA; < 0 (i = 1, ..., k). Mais 
cela veut dire que B € D (M;). Puisque cette inclusion est vérifiée 
pour tout i — 1, ..., k,ona BED(M,)N ...fN D (M;). Ainsi, 


DM &=D(M)N...ND(M). (31.4) 
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Les inclusions (31.3), (31.4) démontrent l'égalité (31.2). 

Corollaire 31.4. Soient M,, ..., M, des cônes convexes 
fermés de sommet commun Q dans E". Alors D (M,fN ...f M;) 
est l'enveloppe convexe des cônes D (M.,), D (M), ..., D (M;). 

Posons N, = D (M,), ..., N;, = D (M,) et désignons par N 
l'enveloppe convexe des cônes N,, ..., N3. Prenant en considéra- 
tion les théorèmes 31.8 et 31.2, nous obtenons 


DW)=D(W)N...NnD(M)— 
=D(D(MN...ND(D(M) = MN ...N M: 
Par conséquent, 
N=D(D(N) =D (MN ...N M). 


Le théorème 31.3 et le corollaire 31.4 nous montrent que (lorsqu'on 
se limite à la considération des cônes convexes fermés), en 
passant aux cônes duaux, l'opération d’intersection est remplacée 
par l’opération d’enveloppe convexe de la réunion et inversement, 
i.e. que ces opérations sont duales entre elles. 

32. Propriété de séparation d’un système de cônes convexes. 
Nous dirons qu’un système de cônes convexes fermés K,, ..., K, 
de sommet commun Q dans £" possède la propriété de séparation, 
si l’on peut les distribuer en deux sous-systèmes dont chacun contient 
au moins un cône, de sorte que l’intersection des cônes du premier 
sous-système est séparable de l’intersection des cônes du deuxième 
sous-système. 

Avant d’énoncer des conditions pour lesquelles un système de 
cônes possède da propriété de séparation, démontrons la proposition 
auxiliaire suivante. 

Lemme 32.1. Soient K,, ..., K, des cônes convexes de l’espace 
E" de sommet commun Q. Le point À € ET appartient à l'enveloppe 


convexe K des cônes K.;, . .., K, si et seulement s'il existe des points 
À; € K\, . À ; € K'; tels que 

— — — 

OA—=QA;+...+OQ0A:. (32.1) 


Démonstration. Supposons que le point À est déterminé 
par les relations (32.1) où À, . .., À, sont des points appartenant 
respectivement aux cônes X,, ..., K7. Notons B,, ..., B, les 
points tels que 


— 4 > —> 1 —= 
OA; + QB:, ...., QA;=-+0QB:. (32.2) 
Les points B,, ..., B, appartiennent respectivement aux cônes 
convexes K,, ..., K, (d’après la définition du cône). La rela- 


tion (32.1) peut être récrite sous la forme (voir (32.2)) 


QA=+QBi+...+7 08 
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et, par conséquent, vu le théorème 25.1, le point À appartient à l’en- 
veloppe convexe de l’ensemble X, |] ...[J K,, ie. AE K. 
Inversement, soit À € K. Alors, en vertu du théorème 25.1 


— — — 
QA= MQC,+ ... LAOC., (32.3) 


où M>0,...,A>O0, AM +... + AS — 1 et tous les points 
C, - .., C sont situés dans l’ensemble X,{J ...{J ÆK,. Nous 
pouvons supposer que la numération des points C,, ..., C, a été 
choisie de manière à ce que les premiers g, points appartiennent 
à l’ensemble X,, les g, points suivants à l’ensemble Æ,, . . ., enfin, 
les derniers g, points sont contenus dans l’ensemble ÆX, (on a alors 


ut HT a nn) 
CiEK; pour q+...+q<i<qi+...+qi+qine 


Nous supposerons en outre que chacun des entiers gqy, . . ., q1 est 
positif; par exemple, si g, — 0, nous pouvons ajouter au deuxiè- 


—> 
me membre de la relation (32.3) le terme AQC, où C € K, et À = 0. 
Désignons par ÀA,, ..., A, les points déterminés par les relations 


qyt...+a; 


—> .—> 
QA;— > ni QC;, j=1,...,l (32.4) 


i=qy+. . -+q; at 


Alors la relation (32.3) se mettra sous la forme (32.1) et l’on pourra 
déduire directement de (32.4), vu le théorème 28.7, que À, € K3, .. 

., A1 € K1. 

Théorème 32.2. Pour qu'un système de cônes convexes jermés 
K;,, ..., K,de sommet commun Q dans E” possède la propriété de 
séparation, il faut et il suffit qu’il existe des points À, € D (K;), ... 
..., A&$ED(K.), dont au moins un diffère du point Q, tels que 


— — : 

OA,+...+0A4,—0. (32.5) 
Démonstration. Supposons que le système de cônes 
convexes fermés X,,..., K, de sommet commun Q possède dans £” 


la propriété de séparation. Sans restreindre la généralilé, on peut 
supposer (quitte à changer la numération des cônes) que ce sont 
les cônes X,N ...fN K;et Kih 1 ... ff À, qui sont séparables, 
où Z est un nombre naturel inférieur à s. Autrement dit, 


Ka ee Ps Rss Ole r, 


où P,, P, sont deux demi-espaces fermés, déterminés dans £” par 
un certain hyperplan l', qui passe par le sommet commun © des 
cônes K,, ..., K,. Soit n = 0 le vecteur normal de l’hyperplan l 


— 
dirigé vers le demi-espace P,, de sorte que n QA4 < 0 pour tout 
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point AEP,etn 04 > 0 DO tout Pine A € P,. Soit, d'autre 


part, B un point tel que nr — 08. Alors n QÀ < 0 pour tout point 
ACK,N ...fN K1, (puisque K,N ...N K;,&P,), et donc BE 
ED (KN ... 1 A). 

[1 découle du corollaire 31.4 que le point B appartient à l’envelop- 


pe convexe des cônes D (K,), , D (K)) et donc (vu le lemme 32.1} 
—  — — 
n=QB—QA;t...+0QA;, (32.6) 
où A; ED(K;), i = 1,..., 1. De la même manière, le point PB’, 
—> 
déterminé par la relation QB'— -n, appartient au cône 
D (K;5N .../fN Æ;), et par conséquent, 
— — — 
—n—QB'—0Q0A,,,+...+04A., (32.7) 


où A,/ED(K;),i—1l+1,...,s. En ajoutant les relations (32.6) 
et (32.7), nous obtenons l'égalité (32.5). Remarquons que parmi les. 
——> 


—+ 
vecteurs O0AÀ,, ..., OA, il doit nécessairement avoir des vecteurs 
non nuls, puisque n =£ 0, et donc au moins un des points À,, ..., À, 
est différent de Q. 

Réciproquement, supposons qu’il existe des points 4,€ 
ED(K;), ..., A,€ D (K.), dont au moins un diffère de Q, qui 
satisfont à la relation (32.5). Supposons, pour préciser, que À, = Q. 


—> 
Désignons par [' l’hyperplan orthogonal au vecteur n — QA, Æ 0 
et passant par le point Q. Comme À, € D (K,), le cône K, est situé 
ans le demi-plan P, formé de tous les points À € £7" pour lesquels 


n Q4 <0. D'autre TR notons A” le point déterminé par les rela- 


tions OA" = —n — OA, desorte que le point 4” se trouve égale- 
ment 1. le demi-espace P,. Si 


Er — — —> 
QA'= —QA;=0Q0A4:+...+04,, 


on voit, d'après le lemme 32.1, que le point À” appartient à l’enve- 
loppe convexe des cônes D (K,), ..., D (K;) et donc (vu le corol- 
laire 31.4) le point À” appartient au cône D (K,f ...f K.). 
Autrement dit, pour Li point AE K:,N ... K,, on a la relation 


—> — 
QA'OA < O0, i.e. n O4 > > 0. Ainsi, le cône K,f] ...f\ K, est 
contenu dans le demi-espace P, admettant tous les points À € E7 


us 
pour lesquels n OA > 0 

Donc, K, € P,,K,fN ...fN K, € P,, i.e. l’hyperplan [ sépa- 
re les cônes X, et K,fN ... MN K, et, par conséquent, le système 
de cônes X,, ..., K, possède la propriété de séparation. 
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Corollaire 32.8. Si aucun des cônes K,,..., K, n’est 
séparable de l'intersection des autres, alors le système de cônes K;, ... 
..., K, ne possède pas la propriété de séparation. 

En effet, si le système de cônes X,, ..., K, (qui sont toujours 
supposés convexes fermés et de sommet commun @) possède la 
propriété de séparation, alors, d’après le théorème 32.2, il existe 
des points À, € D (K;), ..., A, € D (K.) qui satisfont à la rela- 
tion (32.5), parmi lesquels certains diffèrent de Q. Mais alors la 
deuxième partie de la démonstration du théorème 32.2 nous montre 
que parmi les cônes X,, ..., K, il y en a un qui est séparable de 
l'intersection des autres. 

CGorollaire 32.4. Pour qu'un système de cônes convexes 
fermés K;, ..., K, de sommet commun Q dans E” possède la propriété 
de séparation, il faut et il suffit qu'il existe des fonctions affines f,, ... 
..., fs sur ET" qui s'annulent au point Q et qui ne sont pas toutes 
identiquement nulles, telles que la fonction f; soit non positive sur le 
cône K; (i—=1,...,Ss) et en plus 


fa + . + f,=0 


En effet, si ce système de cônes possède la propriété de séparation 
alors, en vertu du théorème 32.2, il existe des points À, € D (K,), ... 
..., AÇ$ED(K,), dont au moins un diffère du point Q tels que 
l'on a la relation (32.5). Désignons par f,, ..., f., les fonctions 
affines sur £”" qui s’annulent au point Q et pour lesquelles les vec- 


— — 
teurs Q4,, ..., OA, sont les gradients. La relation (32.5) nous 
montre alors que ÿ, + ... +ÿf,= 0. D'autre part, puisque 4; € 


> — 

€ D (Ki), on à f; (4) = 0AQ4; < 0 pour À € K;. 
Inversement, s’il existe des fonctions f,, ..., f. satisfaisant 
aux conditions indiquées dans le corollaire 32.4, on peut prouver, 


— 
en définissant les points À4,, ..., À, par les relations Q4; — 
— grad f;, i — À, ..., s et en raisonnant par l’absurde, que les 
points À,, ..., À, satisfont aux conditions du théorème 32.2, 
1.e. le systèmede cônes X.,..., K, possède la propriété de séparation. 

Théorème 32.5. Pour qu'un système de cônes convexes fermés 
K1, ..., K, de sommet commun Q ne possède pas la propriété de 
séparation, il faut et il suffit que l’on ait les deux conditions suivantes : 

1) (relint XÆ,)N .../f (relint K,) Æ GS; 

2) il existe des sous-espaces L., . . ., L, qui donnent la décomposi- 
tion de l’espace E" en somme directe (il est possible que dim L; = 0 
pour certains i) tels que pour chaque iÆj (i, j = 1, ..., s) L; est 
contenu dans un sous-espace parallèle au plan qui supporte le cône K;. 

Démonstration. Supposons que les conditions 1) et 
2) sont satisfaites et que, malgré l’assertion du théorème, le système 
de cônes X,, ..., K, possède la propriété de séparation. Alors, 
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en vue du corollaire 32.3, un de ces cônes (mettons, K.,) est séparable 
de l’intersection des autres, i.e. il existe un hyperplan T passant 
par Q et tel que K, € P,, K,N .:.N K, € P,, où P,, P, sont 
les demi-espaces fermés déterminés par HAYPErDIAN r'. 


Soit À un point quelconque de l’ensemble î (relint Æ;) (un 


tel point existe d’après la condition {)). Alors mn CEK SP,,AE 
€ KoN . N K, € P,, et par conséquent À € P,fN\ P, = T. Pour 
Lee ce le plan M: parallèle à à L; et passant par le point A, est con- 
tenu da ns le plan qui supporte le cône X,;, et, puisque A est un 
point intérieur du cône K, relativement au plan qui le 
supporte, tous les points du plan M; suffisamment proches de À 
appartiennent au cône K,, à donc au demi-espace P,. On peut en 
déduire que Mer (= ..., S). D'autre part, le plan M, 
parallèle à Z., et passant par o est contenu dans les plans qui sup- 
portent chacun des cônes K,, . .., K,, et tous les points du plan M, 
suffisamment proches de À appartiennent à chacun des cônes K,, ... 
, K, et donc à leur intersection. Par conséquent, M, cr. 
Ainsi, tous les plans M,, ..., M; sont contenus dans F. 
Par conséquent, tous les sous-espaces Z., . .., L, (et donc également 
l’espace £" = Z; ® ... ® Z,) sont contenus dans les sous-espaces 
L parallèles à l’hyperplan F, ce qui est impossible, ZL étant un hyper- 
plan qui ne peut donc contenir tout l’espace £”. La contradiction 


obtenue montre que le système de cônes Æ,, ..., K, ne possède 
pas la propriété de séparation. 
Réciproquement, supposons que le système de cônes K,, ..., K, 


ne possède pas la propriété de séparation. Vérifions les conditions 1) 
et 2). Supposons, au contraire, que la condition {) n’est pas satisfaite 
et choisissons un entier positif [ < s, tel que 


(relint K,)N .../f (relint K;) Æ ©, (32.8) 
(relint X:1)N...N(relint K,)N (relint Ky14) = @. (32.9) 


La relation (32.8) nous montre (vu le théorème 26.6) que 
(relint X,) AN ...fN (relint K,) = relint (K, AN ...N K)), 
et donc la relation (32.9) se met sous la forme 
(relint (Ki... NK5)) N (relint K;4)= ©. 


De ce fait on peut déduire, d’après le théorème 30.4, que les cônes 
K,N ...fN\KÆ: et Ky+, sont séparables, et donc que les cônes 
KN ...N Kret Kyf ...fN Æ, le sont a fortiori. Mais ceci 
contredit l’hypothèse. La condition 1) est donc satisfaite. 
Démontrons enfin la validité de la condition 2). Pour cela, effec- 
tuons une récurrence sur le nombre s des cônes considérés. Supposons 
d’abord s — 2. Puisque, par hypothèse, les cônes X, et K,, sont 
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inséparables, on voit, d’après le théorème 30.4, que ces cônes ne 
se trouvent dans aucun hyperplan, i.e. les sous-espaces À et B 
parallèles aux plans qui supportent les cônes X, et ÆX, possèdent 
la propriété suivante: À + B — EE". D'après le théorème 14.13, 
il existe un tel sous-espaceDE B que A ® D—ET.Aïnsi, les sous- 
espaces L, — D, L, — À sont les sous-espaces cherchés, ce qui 
termine la considération du cas s — 2. 

Supposons que la validité de la condition 2) est démontrée lorsque 
le nombre des cônes est inférieur à s, et considérons s cônes X,, ... 
..., À, (qui ne possèdent pas la propriété de séparation). Sans 
restreindre la généralité, on peut supposer que le point Q est l’ori- 
sine des coordonnées de l’espace Æ” de sorte que chaque plan qui 
passe par Q soit un sous-espace de l’espace vectoriel £7 correspon- 
dant. Désignons par II, le plan qui supporte la cône K,, et par IT* 
le plan qui supporte le cône K,f .../f K,_,-. Mais si les cônes 
K,N ...fN XX. et K, sont inséparables, on voit, conformément 
au théorème 30.4, qu’il n’existe aucun hyperplan contenant Il, et 
II, i.e. II, + II* — £. Il existe donc, d’après le théorème 14.13, 
un tel sous-espace ZL, € II* que £7 — IT, ® Z.. 

Considérons maintenant les cônes 


RNA Rank. (32.10) 


situés dans le sous-espace IT... Montrons que ce système de cônes 
convexes fermés (de sommet commun Q) ne possède pas dans l’espa- 
ce II, la propriété de séparation. Supposons, au contraire (voir 
corollaire 82.8), qu’un des cônes (32.10) (mettons, le premier) est 
séparable dans IT, de l'intersection des autres, i.e. le cône K, AN K, est 
séparable dans IT, du cône K,fNN ...fNK,:11 K,. D'après la 
condition 1) déjà démontrée, nous avons 


(relint X,)fN (relint K,)N .../fN (relint K,) Æ ©, 
et donc (vu le théorème 26.6), 
relint (X, AN K.) = (relint X,)N (relint X,), 
relint (K,fN ...fN\ K,) == (relint KX,)fN ...fN (relint K,), 
de sorte que 


(relint (An AN (relint (AN ...N K)) # ©. 


Par conséquent, la séparabilité des cônes K, AN K, et K,N ... 
...f À, dans IT, signifie (d’après le théorème 30.4) que les plans 
qui supportent les cônes X, NN K, et X,f1 .../f Æ, sont situés 
dans un même plan T & IT, de dimension dim Il, — Î. En vertu 
du théorème 26.6, le plan qui supporte le cône X, f\ Æ, coïncide avec 
II, N II,, où IL, est le plan qui supporte le cône K,. Ainsi, Il, N Il, € 
a lie. Il, NA I = TfA II,. Désignons par Il° le plan de dimension 
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minimale qui contient FT et IL, i.e. I[° — © + IT. Alors 
dim (Il, N l) = dim (I, NI.) >-dim Il, + dimIl, —n, 
dim [T° = dim Il, + dim l — dim (IL N << 
dim Il, + diml—(dimlli + dimll,—n)=n—1, 


i.e. let Il, sont contenus dans un même plan de dimension inférieure 
ou égale à nr — 1. Comme K, CII, K,N ...N K,aF, ceci 
implique la séparabilité des cônes K, et K,{ .../f\ K., ce qui 
contredit l’hypothèse. 

Ainsi, le système des cônes (32.10) ne possède pas dans II, la 
propriété de séparation. Maïs si le nombre de ces cônes est inférieur 
à s, alors, d’après l’hypothèse de récurrence, il existe des sous-espaces 
L, ..., Ls_1, en somme directe desquels se décompose le sous- 
espace IT,, tels que pour tout i Æ j (i, j — 1, ..., s — 1), L; est 
contenu dans le plan qui supporte le cône K;fN K,. On vérifie 
directement que ces sous-espaces L,, ..., L,_,, avec le sous-espace 
L, construit précédemment, satisfont à la condition 2), i.e. sont 
les espaces cherchés. (Rappelons que l’espace £" se décompose en 
somme directe des sous-espaces ZL,, et IT,, et donc, d’après le théorè- 
me 14.12, l’espace £” se décompose en somme directe des sous-espa- 
ces ns cu becs 3) 

En comparant le théorème démontré avec le corollaire 32.4, 
nous obtenons l’assertion suivante. 

Théorème 32.6.Supposons donnés dans E" des cônes convexes 
fermés K,, ..., K, de sommet Q qui satisfont à la condition 2) du 
théorème 32.5. Pour que l'intersection 


(relint X,) A ...f (relint Æ,) 


soit vide, il faut et il suffit qu'il existe des fonctions affines f1, . . ., fs 
sur E", qui s’annulent au point Q et ne sont pas toutes identiquement 
nulles et telles que la fonction f; soit non positive sur lecône K; (i = 
5 4, ...,s) et que l’on ait 


hi +... +f,s = 0. 


Dans ce théorème, de même que dans le corollaire 32.4, la condi- 
tion de non-positivité de la fonction f; sur le cône K;,i — 1, ...,s, 
peut être remplacée par lacondition de non-négativité: il suffit de 
changer les signes de toutes les fonctions j,, . .. 

Les théorèmes 32.5 et 32.6 s'avèrent particulièrement simplifiés 
si tous les cônes K,, ..., K,., sauf peut-être un, sont des cônes soli- 
des. Dans ce cas, la condition 2) du théorème 32.5 est automatique- 
ment satisfaite. En effet, supposons que les cônes K,, ..., K, 
sont solides, et X, est un cône quelconque. Pour vérifier la condition 
2), il suffit de choisir pour L, le sous-espace parallèle au plan qui 
supporte le cône X, et pour Z, le complémentaire direct de ses sous- 


17% 


260 ÉLÉMENTS DE LA THÉORIE DES ENSEMBLES CONVEXES [CH. III 


espaces, et enfin pour La:, . .., L, les sous-espaces triviaux (de 
dimension nulle). Remarquons aussi que, vu la solidité des cônes 
K:, ..., K,, la condition (1) du théorème 32.5 équivaut à la con- 
dition 

K,N GntK,)N ...n(intK,) Æ @. (32.11) 


Ainsi, nous obtenons les deux propositions suivantes. 

Corollaire 32.7. Soient K,,K2,..., K,des cônes convexes 
fermés de sommet commun Q, les cônes K,, ..., K, étant solides. 
Pour qu'un système de cônes possède la propriété de séparation, il faut 
et il suffit que l’on ait la condition (32.11). 

Corollaire 832.8 (Théorème de Doubovitski-Milioutine *)). 
Soient K,, ..., K, des cônes convexes solides de E" à sommet commun 
Q et soit K, & E" un plan d'une certaine dimension qui passe par le 
point Q. Pour que l'intersection 


Æntntk)n...fNintK) (32.12) 


soit vide, il faut et il suffit qu’il existe dans E" des fonctions affines 
fs + - …, J Qui s'annulent au point © et ne sont pas toutes identique- 
ment nulles telles que la fonction f, est identiquement nulle sur le plan 
K,;, la fonction f; non positive sur le cône K;, i = 2, ..., set l’on 


a la relation 
fa + . + f, = 0. 


(Remarquons que la non-positivité de la fonction jf, sur K, signifie 
que cette fonction est identiquement nulle sur X..) 


Remarque 32,9. Le théorème de Doubovitski-Milioutine a donc été 
obtenu ici comme un cas particulier de résultats plus généraux. Dans le cha- 
pitre IV, c'est justement ces résultats plus généraux qui seront le fondement 
nécessaire pour obtenir des théorèmes de programmation mathématique. Néan- 
moins, la majorité de ces théorèmes peut être obtenue en se servant seulement 
du théorème de Doubovitski-Milioutine, ce qui explique sa popularité. Par con- 
séquent, quoique ce théorème ne nous serve pas dans la suite d’instrument de 
recherche, nous donnerons quand même ici une démonstration directe du théo- 
rème de Doubovitski-Milioutine, sans se servir du théorème plus compliqué 
(32.5), et d’autres résultats de ce sous-paragraphe. 

Démontrons tout d’abord la nécessité, i. e. montrons que si l'intersection 
(31.12) est vide, alors les fonctions cherchées f,, . .., f, existent. Effectuons 
la démonstration par récurrence sur s. Pour s = 2 l'intersection (32.12) est 
de la forme X,fNj{int K,) et, puisqu'on la suppose vide, le plan X, n’a pas de 

oints communs avec l'intérieur du cône K,. Par conséquent, d’après le corol- 
aire 30.6, le plan X, et le cône K, sont séparables, i. e. il existe une fonction 
affine non constante f sur £" qui s’annule au point Q, est non négative sur 
K, et non positive sur X;. Du fait que f est non positive sur X.,, on déduit qu'elle 
est identiquement nulle sur XÆ,. Par conséquent, en posant f, = f, fo — —f, 
on obtient les fonctions cherchées f,, f.. Ainsi, pour s — 2, la nécessité de la 
condition énoncée est démontrée. 

*) A. Doubovitski, A. Milioutine, Problèmes d'extrémum à conditions sup- 
plémentaires, Journal de mathématiques numériques et de physique mathéma- 
tique, 5, n° 3 (1965) (en russe). 
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Supposons que, dans le cas où le nombre des cônes est inférieur à s, la néces- 


sité est déjà établie, et considérons s cônes solides X,, ..., K, pour lesquels 
l'intersection (32.12) est vide. Si l’intersection 
Ki N (int Xe) N ... NN (int Ks-1) (32.13) 


est vide, alors, d’après l’hypothèse de récurrence, il existe des fonctions f,, .., 
..., fs-1 qui possèdent les propriétés nécessaires, et donc, en posant f, = 0° 
nous obtiendrons les fonctions cherchées j,, . . ., fs. 

Il reste à considérer le cas où l'intersection (32.13) est non vide. Dans ce 
cas, vu le théorème 26.6, l’ensemble (int X,) fN ... f\ (int K,_.) est l’'inté- 
rieur du cône X, NN .../f\Ks-1 et l’ensemble (32.13) est l’intérieur du 
cône K,N K2N...f"\K, (relativement au plan qui le supporte). Aïnsi, les 
cônes A1 MN KaN...MNKs et KÇç n’ont pas de points intérieurs communs 
(puisque l'intersection (32.12) est vide) et donc, d’après le théorème 30.4, ces 
cônes sont séparables. Autrement dit, il existe une fonction affine f non cons- 
tante qui s’annule au point Q, qui est non négative sur X, et non positive sur 
le cône K, N Ko... MN Ks1 


= 

Définissons le point B par la relation QB = grad f. Alors, en vertu du théo- 

rème 31.1 le point B appartient au cône D (K1 N Ka NM... Æs-1), ie., 

vu le corollaire 31.4, le point B appartient à l'enveloppe convexe des cônes 

D (K,),D (Ko), ..., D(K.-1).On peut donc déduire, en se servant du lemme 32.1, 
qu’il existe des points 


CE D(KY), C2€ D(Ko),..., Cs1E D(Ks-1) 


qui satisfont aux relations 


—> —> — 
QB—QC1+...+QCs-1. 


Définissons maintenant des fonctions affines f,, . . ., f-1 Sur E" en posant 


— — 
fi(4)=QA QCi, i=1, ..., s—1. (32.14) 


Il est clair que ces fonctions s’annulent au point Q et satisfont à la condition 


—> — — 

fi (4)+.., + fs-1 (4) = QA (QC +... +QCs-1) — 
—>—> — 

—QAQB—QA grad f—f(4)—f(Q)—7f(4), 


fit +fes st. (32.15) 
D'autre part, puisque C; ED (K;) pour i= 2,..., s — 1 chaque point 


—- 

A du cône K; satisfait à la relation QA QC; < 0 et la fonction jf, est non positive 
sur le cône X; d’après 32.14. D'une manière analogue, la fonction f, est non 
positive sur le plan Æ,; et donc identiquement nulle sur X,. Ainsi, en posant 
fs — —f nous obtenons (vu (32.15)) les fonctions cherchées f;,, ..., fin fe 
(remarquons que ces fonctions ne sont pas toutes identiquement nulles, puisque, 
par exemple, la fonction f, — —f est non constante). La récurrence effectuée 
démontre donc la necessité de l'hypothèse du théorème. 

Démontrons la suffisance, i. e. montrons que dans les conditions d’existence 
des fonctions f,, . .., fs indiquées, l’intersection (32.12) est vide. Supposons, 
au contraire, que l'intersection (32.12) est non vide et À est un point de cette 
intersection. Lorsque À € X,, on a f, (4) — 0. Comme, par ailleurs, À € int K,c 
& K;, on a f; (4) < 0 quel que soit i = 2, ..., s. De la relation f, +... + 
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+ f, = 0 on peut donc déduire que 
fa (4A)=...=7f, (4) = 0. 


Mais si f; < 0 sur l’ensemble K;, la restriction de la fonction j; à K; atteint 
son maximum au point inté rieur À € int X; du solide X;. Par consé- 
quent, d’après le corollaire 29.3, la fonction fe est constante, i. e. f, =0,i— 
= 2,...,s. Mais alors de l'égalité ht+...+f,=00on déduit que f, = = 0 
i.e. que toutes les fonctions f1, . .., cf sont identiquement nulles. 
Mais ceci contredit les conditions imposées sur ces fonctions par le théorème. 
La contradiction obtenue montre que l'intersection (32.12) est vide. 


CHAPITRE IV 


EXTRÉMUMS DES FONCTIONS 


$ 9. Théorèmes d’existence 


33. Applications tangentes. Soit }] un ensemble de l’espace 
euclidien Æ£* et Q un point fixe de l’ensemble A. Soit, ensuite, 
g: M —E® une fonction vectorielle définie sur l’ensemble M, 
i.e. une application qui fait correspondre à chaque point À € M 
un certain vecteur g (À) de l’espace euclidien £". Convenons d'écrire 
4 (4) = 00 (4) si 


g(Q@)=0 et limlg@l 0, (33.1) 
AE |QAI 


Autrement dit, la notation g (4) = oQ (M) signifie que pour chaque 
— 
£ > 0 il existe un tel nombre Ô > 0 que pour À € M et | OA | < 8 


——> 

on a la relation | g (4) | < & | OA |. Si £" est l’espace arithmétique 
et Q — (0,0, ..., 0), alors on emploie la notation o (4) à la 
place de 00 (4). 

Nous nous servirons du symbole 0,4 (4) comme notation généri- 
que: des fonctions vectorielles distinctes seront désignées 
par le même symbole 04 (A), si, bien sûr, elles possèdent la propriété 
indiquée ci-dessus. Avec cette convention, on peut écrire 


0Q (4) + 0 (4) = 0 (4), 


ie. si f: M —E" et g: M — E" sont deux fonctions vectorielles, 
toutes deux de la forme 04 (A), alors la fonction vectorielle f + g 
(définie par l'égalité (f + g) (4) = f (A) + g (A)) est également 
00 (4). D’une manière analogue, si À (4) est une fonction continue 
à valeurs réelles définie sur l’ensemble A7 (ou une fonction bornée 
dans un certain voisinage du point Q), alors À (4)-00 (4) = 00 (4). 

Remarquons que la définition du symbole o, (4) est de caractère 
affine (cf. pages 136 et 154), quoique sa définition ait été donnée 
dans un espace euclidien, puisque dans la formule (33.1) on 
s’est servi de la longueur des vecteurs. Plus exactement, si 
dans un même espace affine on a introduit de deux manières diffé- 
rentes un produit scalaire qui le transforme en deux espaces eucli- 
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diens E*, E° différents, la fonction vectorielle g (A) de la forme 
0Q (A) dans un des deux espaces est également de la forme 0, (4) 
dans l’autre. 

En effet, l'application identique £? — E* (i.e. l'application qui 
envoie chaque point À de l’espace considéré en lui-même) est AS 


ment affine. Par ConRequent d’après le théorème 21.7, | Q4 FRS 
——> 
< M |QA!,, où ÇA L désigne la longueur du vecteur QÀ pour 


— 
la métrique de l’espace £?, et | 04 |, la longueur de ce même vecteur 
dans Æ°. Mais alors 


ob a 


d’où l’on déduit que la validité de la relation (33.1) dans la métrique 
de l’espace £7 implique la validité de cette relation dans la métrique 
de l’espace Æ7. 

On montre d’une manière analogue que la validité de la rela- 
tion (33.1) ne dépend pas du choix de la métrique dans £7. Autre- 
ment dit, si £" et E" sont des espaces affines, alors on peut, pour 
chaque fonction vectorielle g: M— E" (ou M € ET), dire si oui 
ou non g (A) est une fonction de type 04 (4), où © est un point 
donné de l’ensemble M (i.e. si la relation (33.1) est vérifiée pour 
un certain et donc pour tout choix de métrique dans les espaces 
ET, ET. 

D'après ce que l’on vient de dire, tous les faits exposés dans ce 
sous-paragraphe sont de caractère affine. 

Définition 33.1. Soit M un certain ensemble de l’espace 
euclidien £” et Q un point fixe de cet ensemble. Soit, par ailleurs, 
p: M —+ E" une application de l’ensemble M dans l’espace eucli- 
dien £”. Supposons enfin que f est une application affine de l’espace 
ET dans ET. Nous dirons que l’application @ possède f comme 
application affine tangente au point Q, si pour tout À € M on a la 


elation 
p (4) = ÿ (4) + 00 (4). (33.2) 


Signalons un cas particulier de cette définition importante par 
la suite. Soit M un cône convexe quelconque de l’espace ET de 
sommet Q. Soit, d'autre part, une application (dans l’espace E7), 
définie sur tout le cône M, ou bien seulement dans le voisinage du 
sommet de ce cône (ïi.e. dans les points À qui satisfont aux condi- 


— 
tions À € M, | OA | << h où h est un nombre positif donné). Dans 
ce cas, nous pouvons parler d’une application affine tangente ÿ 
pour f ‘application au point Q (si la relation (33.2) est satisfaite). 

Dans le cas général, une application ®: M —E" peut ne pas 
posséder au point Q € M d'application affine tangente. L’applica- 
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tion @ peut aussi avoir plus d’une application tangente. Néanmoins, 
comme le montre le théorème suivant, dans le cas où l’ensemble M 
est « suffisamment solide» près du point Q, l’application affine 
tangente est unique, si elle existe. 

Théorème 833.2. S'il existe un simplexe de dimension n, donc 
un des sommets est le point Q, et ce simplexe est contenu dans l’ensemble 
M © E”, alors l'application affine tangente de l'application o: M — 
— ET au point Q est unique, si elle existe. 

Démonstration. Supposons que @ possède deux appli- 
cations affines tangentes f,, f, au point Q. Autrement dit, 


p (4) = f1 (4) + 00 (4), (4) = fa (4) + oo (4), AEM, 
où f,, jf, sont des applications affines de l’espace £" dans E7. 
Alors, pour À € M 

f1 (4) = fa (4) + 00 (4). (33.3) 
Soit [Q, 4,, ..., 4,1] le simplexe de dimension n contenu dans M. 
La relation (33.3) est vérifiée, en particulier, sur ce simplexe. 


ne 

Posons B; = Q + AQA;, i—1,...,n. Pour un 10 suf- 
fisamment petit, le point PB; est aussi proche que l’on veut de Q 
et appartient au simplexe considéré. Par conséquent, en prenant 
un nombre € > Ô quelconque, on peut choisir un À > 0 tel que 
(d’après (33.8)) on a la relation 


LA (B)—f(B)|<e| O8]. (83.4) 
Mais puisque les applications f, et f, sont affines, 
fi (Bi) = fi (A — D Q + Ai) = (1 — À) ja (Q) + Aa Ai), 
fo (B;) = 9 (CL . À) Q Ed À A ;) ce (1 = À) fo (Q) a À fa (Ai), 


et donc 


fi (Bi) — fa (Bi) = À (ha (Ai) — fa (Ai)). 


— — — 
D'autre part, | QB; | = | 104; | = À | 04; |. Nous obtenons main- 
tenant des relations (33.4) 


(A) —f (A) |<el OA. 


Comme cette inégalité est vérifiée pour tout & > 0, on a |f, (A;) — 
— 2 (Ai) 1 = 0, ie. f, (4) = fa (Ai) G = 1, ...,n). 

En outre, jf, (Q) = f; (Q) (car pour À = © la grandeur 0, (4) 
dans (33.3) s’annule d’après (33.1)). Aïnsi, les applications affines 
f, et f, coïncident dans tous Les sommets du simplexe [Q, 4,,...,A,], 
et, par conséquent, vu le théorème 19.9, les applications f, et f, 
coïncident. 
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Corollaire 33.3. Soit Q un point intérieur de l’ensemble 
M € EE"; alors, si l'application ®: M — E" possède une application 
affine tangente au point Q, celle-ci (si elle existe) est unique. 

Corollaire 33.4. Soit M un cône convexe solide de sommet Q 
dans E" et soit ® une application (dans l'espace E"), définie sur tout 
le cône M, ou seulement dans un voisinage de son sommet. Alors, pour 
l'application ® l'application affine tangente au point Q est unique (si 
elle existe). 

Théorème 33.5. Soient M & E",N & E" et soient ®: M —- 
— ET, b: N — E? des applications telles que ®@ (M) & N. Supposons 
en plus que l'application q@ possède au point Q € M une application 
affine tangente f: E" => ET et l'application %: N — EP possède au 
point Q'—œo(Q) une application affine tangente g: E" — ET. 
Alors h = gof est l'application affine tangente au point Q de l'appli- 
cation £ — %Vop: M — EP. 

Démonstration. Nous avons 


p(4)=f(4) +00 (4), ACM, 


Ÿ(B)= 8 (B)+ 00: (B), BEN, 
et donc 
Ë (4)=% (p(4)) = £g (p (4))+ 00 (p (4)) — 
= 8 (f(4)+ 00 (4)) + 00 (f (4) + 00 (4)). 
Commel |f (4) —Q" [= }f(4) —f(QOI< _. | QA | (voir théo- 
rème 21.7), on] a 00: (f (4) + 00 (4)) — oo (4). D'autre part, 


puisque l’ application g est affine, on ag (f Aie. (4))= g (f (4)) + 
+ 0Q (À). Par conséquent, 


ë (4) = g ( (4)) -+ 0 (4) — k (4) + 0Q (4). 


Considérons l'application tangente dans le cas où l’espace ET 
(l’ensemble d'arrivée) est la droite numérique, i.e. m — 1). Dans 
ce cas, l’application ®: M — ET est une fonction numérique sur 
l’ensemble 7. Supposons que l’ensemble M & E" est ouvert 
(en particulier, il peut coïncider avec l’espace EE”). 

D'après la définition générale 33.1, la fonction affine f définie 
sur E" s’appelle fangente à la fonction @ au point Q € M si l’on 
a la relation (33.2). En vertu du corollaire 33.8, la fonction affine 
tangente f au point Q est unique (si elle existe). Le gradient grad f 
de cette fonction tangent s'appelle également gradient de la fonction 
au point Q et sera noté grad œ (Q). Vu (33.2) et (33.1), nous avons 
 (Q) = f (Q). D'autre part, la formule (21.5) nous donne: 


f(4)=f(0)+QÀ grad f=p(Q)+QÀ grad p(Q). 
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Ainsi, la relation (33.2) se met sous la forme 


e (4) = p(Q) + QA grad p (Q)+ 00 (4). (33.5) 


Nous voyons que si la fonction @ possède au point Q une fonction 
affine tangente, il existe un tel vecteur n (à savoir n — grad œ (Q)) 
que 


p(4)= p(Q)+ RQÀ + 09 (4). (33.6) 


Réciproquement, si la fonction œ est de la forme (33.6), alors la 
fonction affine 


(4) =p(Q)+nQA 


est évidemment la fonction tangente au point Q et l’onan = grad f— 
— grad @ (Q). Ainsi, nous avons donc le 

Théorème 33.6. Soit ® une fonction réelle, définie sur un 
ensemble ouvert M € E". La fonction ® possède au point Q € M une 
fonction affine tangente si et seulement si ® est de la forme (33.6). 
Le vecteur n se détermine d’une manière unique par la fonction @ et le 
point Q; il est désigné par grad œ (Q). 

Signalons également la forme en coordonnées de ce théorème. 


Munissons Æ£" d’un système de coordonnées xl, ..., x" orthonor- 
mées, de sorte que @ (À) — œ (x!, ..., x") soit une fonction de n 
variables. Posons ensuite 
1 n n 
OS; ss 20): A rt) 


et convenons de désigner le point Q par x, et le point À par x. Les 


coordonnées du vecteur n — grad @ (Q) — grad  (x,) sont géné- 
He 0®(xo) 0p(xo) . 
ralement désignées par em en 


grad @ (x) — {+ Go .,,, (33.7) 


ôxi GAL 








Dans ces notations, la formule (33.6) se met sous la forme 


(x) = p ne + (x — 29) grad p (to) + 0x0 (€) — 


= P (to) + > RARES 20) t ri) + 0 (z —Xo), (33.8) 


_ gai 


i.e. se transforme en la bien connue d'analyse mathématique. 

Remarque 33.7. De même que les faits précédents, la rela- 
tion (33.5) est de caractère affine. Mais il faut se rappeler que 
le vecteur grad @ (Q) (i.e. le gradient de la fonction affine f, tan- 
gente à @ au point Q) n’appartien. pas à l’espace E”, mais à l’espace 
dual (on dit que c’est un vecteur covariant). Relativement à la 
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formule (33.5), cela signifie que le produit scalaire doit être compris 
dans le sens du n° 15. Si l’espace £" est un espace euclidien et non 
un espace affine, alors l’espace vectoriel dual peut être identifié 
avec Æ£" (voir la fin du n° 16), tandis que le produit scalaire de la 
formule (33.5) devient tout simplement le produit scalaire usuel de 
l’espace euclidien Æ7. 

La formule (33.8) garde toute sa signification pour un espace 
affine Æ”" (en particulier, dans le cas de l’espace euclidien, elle 
garde Sa signification pour tout système de coordonnées non néces- 
sairement orthonormé). Et alors, l’expression en coordonnées (33.7) 
du vecteur grad ® (x) se rapporte non pas au système de coordonnées 
(xl, ..., x"°) dans £", mais au système de coordonnées de l’espace 
dual correspondant au système de coordonnées (xt, ..., x") de la 
manière indiquée au théorème 15.12. 

Définition 33.8. Soit M un ensemble ouvert de l’espace 
E". Une fonction réelle o définie sur M s'appelle continûment diffé- 
rentiable ou régulière, si le vecteur grad o (À) existe dans chaque 
point À € M et ce vecteur dépend d’une manière continue de À, 
: > Pb Le : OP . 

i.e., en coordonnées, les dérivées partielles Tv i= ea 
existent et sont continues sur l’ensemble 1. 

Définition 33.9. Soit ® une fonction réelle régulière, 
définie sur un ensemble ouvert M de l’espace E". L'ensemble S 
de tous les points À € M qui satisfont à la relation @ (4) = 0 se- 
ra appelé hypersurface lisse (continûment différentiable) dans £" si le 
vecteur grad (4) est non nul dans chaque point A € S. La rela- 
tion œ (4) — 0 s'appelle équation de cette hypersurface. En coor- 
données, l’équation de l’hypersurface s'écrit 


ox, ...,æ)—0, (33.9) 


où (xl, ..., x”) est l’expression en coordonnées de la fonction 
régulière définie dans un certain ensemble ouvert de l’espace ÆE7. 
Pour n — 2, l’équation (33.9) se met sous la forme 


p (x', à?) = 0 


et la notion d’'hypersurface lisse se réduit dans ce cas à la notion 
de courbe lisse (sur le plan des variables xt, x?). Pour n — 3, l’équa- 
tion (33.9) est de la forme 


@ (xt, x?, xÿ) — 0 


et la notion d’hypersurface lisse se réduit à celle de surface lisse 
(dans l’espace des variables xl, x?, x°). 

Soit Q un point d’une hypersurface lisse S déterminée par l’équa- 
tion p (4) = 0. Le vecteur grad p (Q) (ou tout vecteur de la forme 
À grad œ (Q), pour À 0) s'appelle vecteur normal de l’hypersurface 
S au point Q. L'hyperplan qui passe par le point Q et pour lequel 
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le vecteur grad œ(Q) est un vecteur normal s'appelle hyperplan 
tangent à l’hypersurface S au point Q. 

Définition 33.10. Soient S,, S,, ..., S, des hypersur- 
faces lisses définies dans l’espace Æ£" par les équations respectives 


Pr (4) on Ü; Pa (4) = 0, ss Pr (4) — 0, (33.10) 


où chacune des fonctions ,, . . ., ®. est définie dans un ensemble 
ouvert de l’espace £". L'’intersection P de toutes ces hypersurfaces 
(i.e. l’ensemble de tous les points À € E" qui satisfont à la fois 
à toutes les équations (33.10)) s’appelle variété différentiable de 
dimension nr — k dans Æ”, si la condition suivante est satisfaite: 
dans chaque point À € P, les vecteurs 


grad @, (4), grad p: (4), . .., grad ; (4) 


sont linéairement indépendants. Ainsi, par définition, une variété 
différentiable de dimension r dans £" se détermine par un système 
de nr —r équations *). En particulier, une variété de dimension 
n — 1 se détermine par une seule équation. Par conséquent, les 
variétés de dimension nr — 1 de l’espace Æ£”" coïncident avec les 
hypersurfaces. Les variétés de dimension 1 s'appellent également 
courbes. 

Remarquons aussi que la condition d'indépendance linéaire des 


vecteurs grad qi (A), . .., grad ; (A) est équivalente (en coor- 
données) à ce que le rang de la matrice fonctionnelle 

0p1 (4) 04 (4) 0p41 (4) | 

0x1 9x2 ‘dx 
ôgz(4) 2924)  2p2(4) 
Ôx 
0x (4) dx (4) 9x (4) ] 
0x1 0x2 ‘© dx" 


soit maximal (i.e. soit égal à k). 
Il découle des considérations ci-dessus que si les fonctions 


(4), ..., ® (A) s’annulent au point Q et sont indépen- 
dantes en ce point, i.e. les vecteurs grad p, (Q), ..., grad x (Q) 


*) Strictement parlant, cette définition d’une variété différentiable est 
moins générale que la définition usuelle. La définition générale atteste qu’une 
variété différentiable satisfait à un système d'équations de la forme (33.10) dans un 
voisinage de chacun de ses points (ou, comme on dit, localement). Mais la descrip- 
tion globale de la variété par les équations (33.10) peut s’avérer impossible. 
Nous laisserons de côté ces points délicats (dont la clarification détaillée ne se 
fait que dans le cadre de la topologie), en nous limitant ainsi à la considération 
des variétés qui peuvent être déterminées par les équations (33.10). Remarquons 
d’ailleurs que toutes les considérations ultérieures relatives aux variétés diffé- 
rentiables seront essentiellement locales, i.e. elles sont applicables à des 
variétés différentiables quelconques. 
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sont linéairement indépendants, alors le système d'équations (33.10) 
définit une variété de dimension r7 — k dans un voisinage du point Q. 
En effet, puisque les vecteurs indiqués sont linéairement indépen- 


dants, la matrice 2e est de rang k, i.e. un certain déterminant 


d'ordre 4 formé des colonnes de cette matrice est non nul. Ce déter- 
minant dépend d’une manière continue de À et, par consé- 
quent, il est non nul dans un voisinage du point Q. Ainsi, dans un 


A 


certain voisinage du point Q, la matrice est de rang maximal 
k, i.e. les vecteurs grad , (4), . .., grad . (A) sont linéairement 
indépendants. 


Définition 33.11. Soit P une variété différentiable de 
dimension n — k déterminée dans l’espace Æ£"* par les équations 
(33.10) et Q un de ses points. Désignons par Z,; l’hyperplan tangent. 


à l’hypersurface œ; (A) au point Q (i — 1, ..., k). L’intersection 
des hypersurfaces Z,, ..., L, est un plan de dimension n — k 
dans Æ£" (puisque les vecteurs normaux grad œ; (Q), i = 1, ..., k 


de ces hyperplans sont linéairement indépendants). Ce plan de 
dimension nr — k s'appelle plan tangent à la variété P au point Q. 
Chaque vecteur a parallèle au plan tangent s'appelle vecteur tangent 
à la variété P au point Q. 

Théorème 33.12. Soient P, et P, deux variétés différentiables 
de E" possédant un point commun ©, et soient L., L, les plans tangents 
aux variétés P,, P, au point Q. Si L; et L, ne sont pas situés dans un 
même hyperplan de l’espace E”, alors l'intersection P, N P, est, dans 
un voisinage du point Q, une variété différentiable possédant le plan 
tangent L; ( L, au point Q. 

Démonstration. Supposons que P, se détermine dans 
un voisinage du point Q par les une 1 (4) = 0, ..., px (4) == 
— 0, les vecteurs grad p; (Q), i — 1,. k étant linéairement 
indépendants, tandis que la ÉTÉ  P, est déterminée par les équa- 
tions 4, (4) == 0, ..., y (4) = 0, les vecteurs grad 4; (Q), j — 
— 1, ..., l étant également linéairement indépendants. Alors, 


Leone: NL, LL MesenLr, 


où L® est l’hyperplan qui passe par le point Q el qui a pour vecteur 
normal grad (; (Q), tandis que LG) est l’hyperplan qui passe par 
le point Q et qui a grad w; (Q) pour vecteur normal. Supposons que 
les vecteurs 


grad qi (Q), ..., grad x (Q), grad ÿ:(Q), ..., grad#(Q) (33.11) 


sont linéairement dépendants. On a alors la relation 


ot grad p1 (Q) +... + a, grad px (Q) — 
= f, grad #1 (Q) +... + f grad 4, (Q), 
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où au moins un des coefficients æ, ..., &, est non nul, et par 
conséquent, le vecteur a = a, grad p (Q) + ... + a, grad  (Q} 
est non nul. Le vecteur est orthogonal au plan L,, et puisque a — 
— $, grad 4, (Q) + . + $, grad #, (Q) il est orthogonal au plan 
L.. Mais alors, l’hyperplan orthogonal au vecteur & et passant par 
le point Q contient les deux plans Z,, L,, ce qui contredit l’hy- 
pothèse du théorème. Ainsi, les vecteurs (33.11) sont linéairement 
indépendants. 

Il découle de ce fait que les équations p, (4) — ... — ox (À) — 
— 1, (À) — — 1, (4) — Ô déterminent une variété différen- 
tiable dans un n voisinage du point Q. Il est évident que cette variété 
coïncide (près de Q) avec l’intersection P, fN\ P,, et son plan tangent 
au point Q avec 


LD n...nLPnzn...nLP = Lin Le. 


Théorème 33.13. Soient P une variété différentiable de 
dimension n — k déterminée dans l'espace E" par les équations (33.10) 
et Q un de ses points. Soient, d'autre part, L le plan tangent à la va- 
riété P au point Q, et M le plan supplémentaire (de dimension k) à L 
dans l’espace E". Désignons par n la projection de l’espace E" sur le 
plan L parallèlement au plan M. Il existe alors une boule ZX de centre Q 
telle que la partie de la variété P contenue à l'intérieur de la boule ZX 
est appliquée d’une façon bijective par la projection x sur un certain 
voisinage du point Q du plan L (fig. 112). Et nous avons alors la rela- 
lion 


n(4)=A+oo(4), AEP. (33.12) 


Démonstration. Supposons que les vecteurs e,, . .., ex 
sont une base du plan M et les vecteurs e,+,, . . ., e, une base du 
Ü ? n . r . 

plan L. Alors, e, . .., e, est une base de l’espace ET. Considérons 
dans Æ" le système de coordonnées (Q ; e;, ..., eh). Introduisons 
ensuite dans l’espace E" un nouveau produit scalaire en posant. 


ab = 2y +... +zrx'y 
pour des vecleurs quelconques 

a = xle + ... +zr'e,, 

b—y'e + ... +y'e, 
(cf. exemple 16.3). Le produit scalaire ainsi introduit (au lieu de 
celui donné à l’origine), l’espace Æ£" devient un nouveau espace 
euclidien noté E?. 

Il nous suffit de démontrer le théorème en considérant l’espace 

E*, puisque tous les faits qui se rapportent à l’énoncé du théorème 


sont de caractère affine et ne dépendent donc pas du choix de tel 
ou tel produit scalaire. Dans l’espace Æ* le système des coordonnées 


272 EXTRÉMUMS DES FONCTIONS [(GH. IV 


(Q ; ex, ..., e,) sera orthonormé; c'est dans ce système de 
coordonnées que nous allons raisonner. 
Désignons par Z,; Eu tangent à l’hypersurface qi (A) = 


— (0 au point Q (i = 1, , k), de sorte que L = L; N ... N Lz. 
Nous pouvons écrire 

grad p; (Q) = ai +b;, i=1,..., k, 
où le vecteur «a est parallèle au plan L, tandis que le vecteur b;est 
parallèle au plan M. Il est aisé de voir que les vecteurs b,, ..., b, 





Fig. 412 


sont linéairement indépendants. En effet, si l’on a la relation 


B101 +... + Brdz = 0, 


le vecteur 


B1 grad pi(Q) +... +Bz grad pa(Q)=f4 ai +... + fx ax 


est parallèle au plan ZL (étant une combinaison linéaire des 


vecteurs &, ..., @) et orthogonal au plan Z (étant la 
combinaison linéaire des vecteurs grad @; (Q), i — 1, ..., k). Par 
conséquent, 


B1 grad ps (Q) +... + $, grad px (Q) =0, 


et donc (vu l’indépendance linéaire des vecteurs grad œ; (Q), i — 
= 1,..., &) nous obtenons f, — . = $;, — 
Remarquons maintenant que la relation 


DR 6,4... +R, 121, ...,k. (33.13) 


| ri 


ga 


M 0x" 
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L'indépendance linéaire des vecteurs (33.13) signifie que le détermi- 
nant 


det | 2m (Q (33.14) 


Oxi 





À, —=1; À 


est non nul, i.e. le déterminant composé des premières 4 colonnes 
de la matrice (vp; (Q)/0x?) est non nul. 

Il découle du théorème sur les fonctions implicites, que le systè- 
me (33.10), ou, en coordonnées, le système 


1 n\ 1 n\ 

Du uss ae 0 ans D OR sm) 0 (33.15) 
peut être résolu relativement aux inconnues xl, ..., x* dans un 
certain voisinage du point Q = (x, ..., x?) (notons que chacune 
des fonctions p,, . .., ®, est définie sur un ensemble ouvert, 


et ces fonctions sont donc définies dans un certain voisinage du 
point Q). Cela signifie que l’on peut écrire les relations 


a'=vp(att, 2), id, ...,k, (33.16) 


équivalentes au système d’équations (33.15) dans un voisinage du 
point Q. Plus exactement, les fonctions Ÿ° sont régulières et il existe 
une boule Z de centre Q dont chaque point satisfait au système 
d'équations (33.16) dès qu'il satisfait au système d'équations (33.15), 
et inversement. 

Montrons que chaque plan parallèle à A7 coupe la partie de la 
variété P contenue dans la boule © en un seul point au plus. En effet, 
soient À — (xl, ..., x") et À, — (x, . .., a?) des points tels que 
À, Ax; EP NZ, les deux situés dans un même plan parallèle 


à M, i.e. le vecteur AA, est parallèle au plan A7. Les inclusions 
A, A,E P NAN 2 signifient que le point À satisfait aux relations 
(33.16) et le point À, à des relations analogues 

Did (FE san), aus (33.17) 


D'autre part, puisque le vecteur 
P P 
n 
AA,={ti— xt, ...,a2n—x"} 


est parallèle au plan M, ses coordonnées de numéros 4 +1, ...,n 
s'annulent, i.e. 


R+1 — ht = 
RPM DD. 


Mais alors, d’après (33.16) et (33.17), on a les relations 
tit, ...,2teu, 
et les points À et À, coïncident. Ainsi, l’ensemble P N] Z est projeté 
d'une façon bijective sur son image x (P AN] X). 
18—01208 
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Remarquons maintenant que le point Q — (0,0, ..., 0) appar- 
tient à l’ensemble P N\ Z et, d’après (33.16), on a 
4 (0,0, ..., 0) = 0, md so (33.18) 


Donc, vu la continuité des fonctions 4°, les grandeurs (33.16) seront 
suffisamment proches de zéro dès que les nombres z**1, ..., 
le sont. Il en! découle que si le point B— (0, ..., O,a2**1, ..., x") 
du plan Z est suffisamment proche du point Q, alors le point À — 
— (xl, ..., ah,attl, ,.., x") déterminé par les relations (33.16) 
est également suffisamment proche de Q et appartient donc à l’en- 
semble P N ©. Il est également clair que ce point satisfait à la 
relation B — x (A). Ainsi, tous les points du plan Z suffisamment 
proches du point Q sont contenus dans l’ensemble x (P f} Z), i.e. cet 
ensemble est un voisinage du point Q dans le plan Z. 

I] reste à vérifier les formules (33.12). Soit À un point quelconque 
de la variété P. Nous avons 


p: (4) = 9: (Q)+ QÀ grad qi (Q) + 09 (4) 
et lorsque œ; (4) — 0, œp; (Q) — O(car AE P, QE P), on a 


ES 
OA grad p;(Q)=0o(4), i—=1,...,k, AEP. 


Si, d’autre part, le point B — n (A) appartient au plan Z, le vec- 
—- 
teur QB est parallèle à Z, et donc QB grad ®; (Q) — 0. Ainsi, 


AB grad q; (Q)= (QB— QÀ) grad @; (Q)—00 (4). (83.19) 


Notons maintenant que le plan 7 est le supplémentaire orthogo- 
nal du plan Z (puisque nous raisonnons dans l’espace Æ?). Les vec- 
teurs grad @, (Q), . .., grad , (Q) sont orthogonaux au plan Z, 
donc parallèles à A. Par conséquent, ces vecteurs, étant linéairement 
indépendants, forment une base du plan M. Donc, 


e;= &;j grad p; (Q) + Apr + dir grad PR (Q), 11, …..) k, 


où les a;; sont des nombres. Comparant la dernière égalité aux rela- 
tions (33.19), nous trouvons 


> 
e; AB — 0Q (À), it, ed k. (33.20) 
Enfin, supposons que 
us 
AB=zxt(A)e;+...+z2*(A)e, 


- L] LA 
est la représentation du vecteur AB sous forme de combinaison 
L3 Ld L} 
linéaire des vecteurs de la base (notons que le vecteur 4B est ortho- 
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oonal au plan Z). Désignons par Ë (A) le plus petit des nombres 
s — 
2t (4) 1, ..., [x (4) |. Comme x° (4) — e;AB (la base e,, ... 


., En étant orthonormée), on a d’après (33.20), x° (4) = 09 (4), 
i— 1,...,k, et donc E (4) — 09 (A). D'autre part, 


LABI= VE. + AP <V nr EG V RE (4) 


et, par, conséquent, | AB | = 04 (4), ou, ce qui revient au même, 


A 09 (A). Se rappelant que B — x (A), nous obtenons la for- 
mule (33.12). 

Théorème 33.14. Soient P une variété différentiable de 
dimension n — k de l’espace ET et Q un de ses points. On peut alors 
introduire dans un voisinage du point Q de la variété P des coordonnées 
locales Ë*, . ER: Cela signifie que l’on fait COS RORArE à Fu 
système de nombres que satisfait à la condition Et |< 6, i — 1, . 

.., n —k,un point A (Et, , E"-*) de la variété P, de sorte que 
chaque point À € P suffisamment proche de Q se met d’une manière 
unique sous la forme À — À (Et, , EÉ*-*), On a, d'autre part, la 
relation 


A(E, ..., Eh) Q+Eai+ HE so (8), (33.21) 


OU. dir sont des vecteurs linéairement indépendants de E", 
AR En-#\ est un vecteur de l’espace arithmétique de 
dimension n — ke Enfin, tous les vecteurs a;, . .., &h_x sont des 
vecteurs tangents à la variété P au point Q, et chaque vecteur tangent 
à la variété P au point Q s'exprime linéairement en termes des vec- 
LEUTS y, + +. An-r: 

Démonstration. En continuant les raisonnements effec- 
tués pour la démonstration du théorème 33.13 (et conservant les mêmes 


notations), posons À (Et, , En) — pl (Et, ere. 
ns PE ere he CR . ÉCrti se: Lg Ron i.e. désig- 
nons par À (EL , £"-*) le point qui nu dans le système 


(Q ; Ex» e,), lé. coordonnées 


x! = 1! (ae #49 _) 


_g (33.22) 

: LIL Lis 
où w, ..., d* sont les fonctions contenues dans les deuxièmes 
membres des relations (33.16). Le ur A CE, .., £*-" est bien 
défini pour toutes les valeurs El, . .., E"À suffisamment petites 


18% 
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en valeur absolue, i.e. il existe un tel Ô > 0, qu’à chaque système 


de nombres E!, . £t-À satisfaisant à la condition TE | << Ô, 
i—1Â,...,n — k correspond un certain point À (Et, Tu LE 
I1 découle directement de (33.22) que les coordonnées x!, .. 

de ce point vérifient les relations (33. 16) et, donc À (Et, . , Em he 
€ P. Dans ce cas, les coordonnées x!, ..., x" de tout point A € P 
suffisamment proche de Q satisfont aux relations (33.16) et il existe 
donc un système de nombres Et, , E*-À (déterminés évidemment 


de manière unique) qui satisfait aux relations (33.22). Autrement 
dit, chaque point À € P suffisamment poele de Q. s'écrit d’une 
manière unique sous la forme À — À (£!, He 
D'autre part, puisque les coordonnées g#1 , æ” du ee 
A (Et, , E"-*) sont respectivement égales AT ER nu 
(voir (83. 29). on à 


nA (Et, ..., Eh) =Q+tleut...+Et"er 
et, par conséquent, d’après (33.12), on obtient la relation 


A (es RAS Er) = Q + fer + CE + ET he, +00 (A (E”, 1e) SE 
(33.23) 


Il en découle que 
— 
Etes... +Ethe, =OA(E, ..., ET) Ho (A (Et, ..., ETF), 


donc, 


0Q (A + Fe En) 9 (Éter 44 + tone +E" te). 


Si, enfin, la longueur du vecteur &le,,, + ... + E"-*e, est égale 
à V (EY + a ep (Er) à la longueur du vecteur £ — 
= {E", En on à Oo re Era + -.. + Et-Ée,) = 0 (6), et 


la formule (88. 23) s'écrit sous la forme 
A, ..., Et) Q+Etenst .…. +Ete, Ho (E). 
Ainsi, la relation (33.21) est vérifiée pour 
Ai = Epit, -..) En-h = En: (33.24) 


On voit également de (33.24) que tous les vecteurs @1, . . ., 4n-r 
sont des vecteurs tangents à la variété P au point Q, et que chaque 
vecteur tangent à la variété P au point Q s'exprime linéairement en 
termes des vecteurs @, . . ., 4h _r (les vecteurs ex41, . . ., e, formant 
une base du plan tangent L à la variété P au point Q). Le théorème 
est démontré. 

Considérons maintenant le cas, dans un certain sens contraire 
au cas étudié dans le théorème 33.6, à savoir le cas n — 1. Soit 
un certain nombre positif (le cas À — œ est possible); désignons 
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par M le demi-intervalle [0, k] de la droite numérique Æ*. L’appli- 
cation continue o: M—-EÆE" s'appelle courbe paramétrisée (ou 
simplement courbe) issue du point Q — œ(0). Supposons que 
possède au point 0 une application affine tangente f: Æ°— E”. 
Dans ce cas, le vecteur 


a =f(1) —f(0) —f(1) —Q 
s'appelle vecteur tangent à la courbe œ qans son point origine Q 
(fig. 113). D'après la définition de l'application tangente, nous 
avons (pour les points { appartenant au demi- 
intervalle M — [0,h)) 


p()= 7 ()+0 (6) = p(0)+(7 (6) — f (0))+o () — 
= (0)+# (7 (1)—7 (0))+o ()= p (0)+ta+o (i). 


Ainsi, si la courbe @:1[0, h) — ET possède au 
point Q — œ@(0) un vecteur tangent a, on a 
la relation 


p(t) — p(0) +ia +o(t). (35.25) 


On voit que la réciproque est vraie: si pour U=o9 =) 
chaque courbe on a la relation (33.25), alors 





a est un vecteur tangent à la courbe œ au Fig. 113 
point Q — œ (0). 
Si l’espace E7 est muni des coordonnées y!, ..., y”, la donnée 


de la courbe  (f) est équivalente à la donnée de m fonctions numéri- 
ques (les coordonnées du point œ (#)) sur le demi-intervalle M — 
p () = (y° (), y @), ..., y7 ©). 
Le vecteur tangent & à la courbe œ (f) se met dans ce cas (dans le 
même système de coordonnées) sous la forme 
5 {+ (0) dy? (0) 40? 
7 dt dE 7 de * "+. “da ° 


9 


Théorème 33.15. Soit œf(t) une courbe issue du point 
Q (— p (0)) et possédant au point Q un vecteur tangent a (— dœ (0)/df). 
Soit, d'autre part, 1 (A) une fonction régulière définie dans un certain 
voisinage du point Q. Alors; 


b (p ()) = Ÿ (0) + £ (a grad + (Q)) + o (), (33.26) 


ou, autrement dié, 


d 
GO) L à grad p(Q). (33.27) 


Îl en découle que si le produit scalaire (33.27) est positif, alors pour tous 
les t > 0 suffisamment petits, on a l'inégalité 1 ( (#)) > vw (œ (0)). 
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Autrement dit, pour chaque point A différent de Q, situé sur la courbe 
et suffisamment proche de Q, l'inégalité (4)>>1 (Q) est vérifiée (fig. 114). 
Mais si le produit scalaire (33.27) est négatif, alors on a 1 (A) << % (Q) 
pour tout point À == Q suffisamment proche de Q et situé sur la courbe 
considérée (fig. 115). 

Démonstration. D'après (33.25), l'application affine 


f (@) = p (0) + ia = Q +ia 


(définie sur la demi-droite numérique) est tangente à œ au point 0. 
De la même manière, vu (33.5), l'application affine 


g (4) = (0) + QA grad Ÿ (Q) 


est tangente à 1 au point Q. Par conséquent, en vertu du théorème 





Fig. 114 Fig. 115 


33.9, l'application affine k — gof est tangente à op, i.e. 1 (p (£)) — 
— h (t) + ot). Il ne reste qu’à démontrer que 


h (0 = 8 (f (0) = (0) + Of (À grad Ÿ (0) = p (0) + tagrad p (0). 


34. Coupole d’un ensemble. Définition 34.1. Soit Q 
un ensemble de l’espace Æ" et QE Q. Soit, d'autre part, M un 
certain cône convexe de sommet Q également situé dans l’espace Æ. 
Le cône M sera appelé coupole de l’ensemble Q au point @Q, si l’on 
peut trouver une telle application continue 1 (définie pour tous les 
points du cône M suffisamment proches) à valeurs dans l’espace Æ7 
tel que les conditions suivantes sont satisfaites : 

1) l’application identique de l’espace Æ" est tangente à l’appli- 
cation 1% au point ©, ïi.e. 


Ÿ (4) = À + 00 (4); 


2) pour tous les points À € M où l'application # est définie, 
la relation 14 (A) € Q est remplie. 
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Cette définition signifie, grosso modo, que le cône M (i.e. la 
coupole) est contenu dans l’ensemble Q « à 0, (A) près » (fig. 116). 
Remarquons que si M est une coupole de l’ensemble Q au point @, 
alors chaque cône convexe de sommet Q plus petit que M 
(i.e. contenu dans /) est également une coupole de l’ensemble Q 
au point Q. Il est donc intéressant de trouver la coupole maxi- 
male de l’ensemble Q au point Q (si toutefois elle existe). 

La coupole maximale n'existe pas toujours. Si, par exemple, 
Q est la partie du plan qui est un angle supérieur à x (de sommet ©), 





Fig. 116 Fig. 117 


alors tout angle de sommet Q inférieur à x et contenu dans Q sera 
une coupole de l’ensemble Q au point Q, mais il n’existe pas de cou- 
pole maximale. 

Les deux théorèmes ci-dessous donnent une description de la 
coupole d’un ensemble pour les deux cas les plus importants par 
la suite *). 

Théorème 34.2. Le cône d'appui M d'un ensemble convexe 
fermé Q dans un point quelconque Q € Q sera une coupole de l'ensem- 
ble Q au point Q. 

Démonstration. Désignons par £” le plan qui supporte 
l'ensemble convexe Q. Le cône M y est également situé. D’après le 
théorème 29.5, pour chaque point À € E", il existe dans l’ensemble 
Q un point unique le plus rapproché du point A. Dési- 
gnons Ce point par 1 (À). 

Le point 14 (4) coïncide avec À si À € Q. Mais si le point À 
n'appartient pas à l’ensemble Q, alors la boule de centre À, dont 
la surface contient le point w (A), n’a pas de point commun avec Q 
autre que le point 1# (4) (fig. 117). L'application w est définie et 


*) En fait, dans les deux cas, la couople construite sera maximale, mais nous 
ne démontrerons pas ce fait, car il ne servira pas par la suite. 
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continue sur tout l’espace E", mais nous considérerons seulement 
sa restriction aux point dux cône M. 

Pour démontrer le théorème, il suffit d'établir que l’application 
+ satisfait aux conditions 1), 2) de la page 278. 

Comme pour chaque point À € M, nous avons 4 (4) € Q, la 
condition 2) est satisfaite. 

Vérifions la condition 1). Choisissons un nombre positif quel- 
conque € (égal ou inférieur à 1) qui restera fixe pendant le raisonne- 
ment. Considérons une sphère de centre Q et désignons par Z l’in- 

tersection de cette sphère avec le 
cône M (fig. 118). Soit B € ©. 
Désignons par /3 la demi-droite 


HT issue de Q qui passe par le point 
LA LES B et considérons toutes les de- 
570422, A X A0 


7, 2 
DE mi-droites issues deQ qui forment 
re avec la demi-droite /, des angles 


PR REZ 
NUS 


QT À a < 

Q fier ne inférieurs ou égaux à €. Ces 
RUE < Ma demi-droites remplissent dans 
da Fe l’espace E” un cône convexe 
. fermé (voir l'exemple 28.6) qui 

& sera désigné par K, (B). 
 —. Comme BE X, i.e. la demi- 
droite /8 est contenue dans le cône 
M, le cône K, (B) contient les 
Fig. 118 demi-droites qui passent par des 


points de l’ensemble Q différents 
de Q. Autrement dit, l’intersec- 
tion À, (B) f\ Q possède des points différents de Q. Cette intersection 
est un ensemble convexe fermé. Si l’ensemble X, (B) N\ Q contient 
des points extérieurs à la boule de rayon 1 et de centre Q, alors 
nous poserons d (B) — 1. Mais si l’ensemble À, (B)f\ Q est entiè- 
rement contenu dans cette boule, nous désignerons par d (B) la plus 
grande distance de Q aux points de l’ensemble Æ, (B) A Q. Il est 
évident que d(B)=>0, puisque l’ensemble Æ,(B)f Q contient 
des points différents de Q. 

Ainsi, d (B) est une fonction positive définie sur un en- 
semble borné fermé ©. On démontre sans difficulté que cette fonc- 
tion est continue. Par conséquent, la valeur minimale de la fonction 
d (B) est positive, i.e. il existe un tel k > 0 que d(B) > hk pour 
tout point B € à. 

Soit maintenant À un point quelconque du cône M, différent 
de Q, situé à une distance de Q inférieure à hk. Désignons par B le 
point d’intersection de la demi-droite issue de © et passant par le 
point À avec l’ensemble ©. Lorsque d (B) > h, l’ensemble X, (B)f 
N 9 contient un point C à une distance de Q supérieure ou égale à À. 
Autrement dit, C € Q, et l’angle entre les demi-droites issues de Q 
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et passant respectivement par les points À et C est inférieur ou 
égal à & (voir fig. 118). Le point À’ de la demi-droite qui passe par C 
sur lequel se projette orthogonalement le point À appartient à l’en- 
semble Q (car il est situé sur le segment qui joint les points Q et C). 
Mais la distance entre les points À et 4” est inférieure ou égale à 
| QÀ |-sin &, donc inférieure à & | QA |. Mais alors le point 1 (4) 
de l’ensemble Q le plus proche de À est a fortiori situé 


à une distance inférieure à € | oÀ | du point À, i.e. 
—> — 
jp (4)—AÏ<elQA] pour [QAÏ<h, AM. 


Puisque dans ce raisonnement le nombre & => 0 était quelconque, 
nous obtenons 


fn PO ÈL ee — 0, 
Aen |QAI 


ce qui signifie (avec la relation évidente 1 (Q) = Q) que w (4) — 
— À + 04 (A), i.e. la condition 1) est valable. 

Avant d’énoncer les théorèmes suivants, donnons quelques défi- 
nitions. Introduisons dans l’espace Æ" un système de coordonnées. 
z1, ..., z" et écrivons chaque point À € E”" à l’aide de ces coordon- 
nées: À — (zl, ..., 2") — z. Soit g!(z), ..., g" (z) un système 
de fonctions régulières définies dans l’espace Æ'. Désignons par Q 
l’ensemble de tous les points À = (zl, ..., z") € ET qui satisfont 
aux conditions : 

ES des OU. (34.1) 


Convenons d’appeler restriction chacune des inégalités g° (z) < 0 
qui participe à la définition de l’ensemble ©. | 

Si dans un certain point z, € Q, on a la relation g° (z5) = 0, 
alors la restriction g' (z) < 0 sera appelée active au point z,, mais 
si £g°(zo) < 0, alors g°(z) L 0 est une restriction non active au 
point Z,. Ainsi, pour chaque point z, € Q, toutes les restrictions 
(34.1) se décomposent en restrictions actives et non actives en ce 
point. L'ensemble de tous les indices à pour lesquels les restrictions 
g" (z) L O0 sont actives au point z, € Q est appelé zone d'activité 
et désigné par I (z,) (et parfois par J (z:)). 

Exemple 34.3. Considérons les relations 

{2} —2<0, +72 —2<0, z2—7:-2<0 (34.2} 


sur le plan z!, z?, i.e. considérons le cas de trois restrictions 
(34.1), où gt (21? — 27, gt 2 +4 7% 2, gs = 72 — 7 — 2. La 
restriction (34.2) détermine dans le plan z!, z° l’ensemble Q repré- 
senté fig. 119. Au point a la première et deuxième restrictions sont 
actives ; autrement dit, 7 (a) = {1, 2}. Au point b seule la deuxième 
restriction est active, et au point c la troisième: Z (b) — {2}, I (c) — 
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— {3}. Au point d toutes les restrictions (34.2) sont non actives, 
i.e. la zone d'activité Î (d) est l’ensemble vide. 

Remarquons que parmi les restrictions (34.1) certaines peuvent 
être non actives dans tous les points de l’ensemble Q et partant, 
ne peuvent pas être éliminées de la définition de l’ensemble Q. 
Considérons, en guise d'exemple, l’ensemble Q déterminé sur le 
plan des variables z!, z? par les relations 


9—(z1— 4) —()<O0, 9— (2144) —(2)<O, 
Je 4P<0 2) (CE 0, (34.3) 
(21) + (2) —9<0 


(fig. 120). Il est évident que la dernière restriction (34.3) n'est 
active en aucun point de l’ensemble Q. Néanmoins, on ne peut 
pas éliminer cette restriction, car 
l’ensemble déterminé par les quatre 
premières restrictions (34.3) contien- 
dra, en plus de Q, l’extérieur de 
la figure représentée sur le dessin 
120 par une ligne grasse. 

Les fonctions g', à l’aide desquel- 
les on a écrit les restrictions(34.1), 
étant supposées régulières, on peut 
considerer dans chaque point z, € Q 
les vecteurs grad g'(zo), à = 1... 
..., k&, et, en particulier, les vec- 
teurs 


grad g' (20); ET (20), (34.4) 


Fig. 119 qui correspondent aux restrictions 

actives au point z,. Nous dirons 

que le système de restrictions (34.1) est non dégénéré au point z, € Q. 

s’il existe dans £” un vecteur a qui a des produits scalaires stric- 
tement négatifs avec chacun des vecteurs (34.4): 


a grad g'(z) <0 pour iE I (20). (34.5) 


Si l’ensemble Z (z,) est vide (comme, par exemple, au point d, 
fig. 119), le système des vecteurs (34.4) ne contient aucun vecteur 
et le système de restrictions (34.1) est considéré, par définition, non 
dégénéré. 

Notons que si les vecteurs (34.4) sont linéairement 
indépendants, le système de restrictions (34.1) est non 
dégénéré, car on peut trouver des vecteurs b;, à € ZI (z,) qui possè- 
dent la propriété 


b; grad g° (20) — 





1 pour i—)j; 


0 pour i£)j 
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(où i, j € L'(2)), et alors Le vecteur &« — — > b; a des produits 


1EI (zo) 

scalaires strictement négatifs avec tous les ne (34.4). Par 
exemple, en chaque point z, de l’ensemble Q représenté fig. 119, 
le système de restrictions (34.2) est non dégénéré, puisque, comme 
il est aisé de voir, les vecteurs (34.4) sont linéairement indépen- 
dants. 

Cependant, l'indépendance linéaire des vecteurs (34.4) n’est 
aucunement une condition nécessaire de non-dégénérescence 





Fig. 120 


du système de restrictions (34.1) au point z,. En effet, considérons 
un vecteur quelconque a de Æ7 et choisissons les vecteurs quelcon- 
ques €, . . ., ex, dont les produits scalaires avec & sont négatifs, 
en adoptant le nombre k de ces vecteurs plus grand que n. 
Soient, d'autre part, f,, ..., f, les fonctions affines qui s’annulent 
au point z, et satisfont aux conditions grad f; = e;, i — 1, ..., k. 
Âlors, le système de restrictions f, < 0, ..., fr 0 (elles sont 
toutes actives au point Z,) est non dégénéré au point z,, quoique les 
vecteurs grad j;, à = 1, ..., k, soient linéairement dépendants, 
leur nombre étant supérieur à la dimension n de l’espace E7. 

La signification géométrique de la non-dégénérescence est la 
suivante. Considérons, pour i € I (25), le demi-espace P; de tous 
les points Z2€Æ"* pour lesquels (z — z,) grad g* (z,) < 0. Nous 
obtenons alors les demi-espaces P;, i € I (0), qui correspondent 
aux restrictions actives au point z,, et l’hyperplan qui limite le 
demi-espace P; est orthogonal au vecteur grad g° (z,) et passe par 
le point z,, i.e. c’est l’hyperplan tangent à l’hypersurface g* (z4) — 
= 0, iET(z). La condition de non-dégénérescencel signifie que 
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l'intersection de tous les demi-espaces P;, i € I (z,) est un cône 
solide de Æ", i.e. les demi-espaces ouverts correspondants 
ont une intersection non vide. 

Théorème 34.4. Soit Q un ensemble défini dans l'espace E" 
par les restrictions g (z) < 0, où g (z) est une fonction régulière, définie 
dans un ensemble ouvert de l’espace ET". Soit, d'autre part, z € Q 
un point tel que g (zo) = 0 et grad g (z,) = 0. Désignons par M le 
demi-espace de tous les points z € E" pour lesquels (z — 29) grad £g (25) 
< 0. Alors M est la coupole de l’ensemble Q au point z, (fig. 121). 


grad wZ;/ 





gro /2/ 





TT 
À nt CRAN SEE GORE MER 

S CORERS DER CRUE GARERR HENRES GONE a 
Lt 
ET 


Fig. 121 Fig. 122 


Démonstration. Choisissons une demi-droite Z issue du 
point z, telle que le vecteur unité & qui a la même direction possède 
un produit scalaire négatif avec le vecteur grad g (z,). Consi- 
dérons l’hypersurface déterminée par l'équation g (z) = 0 (rappe- 
lons que g (z) est une fonction régulière définie dans un ensemble 
ouvert; voir définition 33.9). Désignons par F un morceau de cette 
hypersurface près du point z,, et choisissons-le si petit (fig. 122), 
que toute droite proche de } parallèle à la demi-droite Z coupe F 
exactement en un point (voir théorème 33.13). D'autre part, dési- 
gnons par ll’hyperplan qui limite le demi-espace M, i.e. l’'hyperplan 
composé de tous les points z pour lesquels (z — z,) grad g (z,) = 0. 

Soit z un point quelconque de l’espace ET. Désignons par m, 
la droite parallèle à Z qui passe par le point z. La droite m, coupe 
l’hyperplan [en un certain point y (z) et, si le point z est suffisam- 
ment proche de z,, elle coupe l’hypersurface F en un point f (z). 
Lorsque l'est l’hyperplan tangent à l’hypersurface F au point z,,on a 


f (z)— Y (2) = 02 (2), 


puisque y (z) = x (f (z)), où x est la projection de l’espace Æ£" sur 
l'hyperplan T parallèlement à Z (voir (33.12)). 
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Posons maintenant 


Da) =2+ (f(2) — 7 (c)). 


L'application 1 est définie près du point z, et prend ses valeurs dans 
l'espace ET. Montrons que l'application 1, restreinte à un voisinage 
du sommet z, du cône M, possède les propriétés 1), 2) indiquées 
dans la définition 34.1, ce qui démontrera que M est une coupole 
de l’ensemble Q au point 2,. 

Lorsque 1 (z) — z — f (z) — y (z) = o0,, (z), la condition 1) est 
satisfaite. Il reste à établir la condition 2), i.e. montrer que (2) € 
€ Q pour les points z € M suffisamment proches de z,. 

Mais si f(z)E F, on a g(f (z)) — 0 (tous les points de l’hyper- 
surface F satisfaisant à l'équation g (z) — 0). Par conséquent, 


g(b())=£(b(2)) — 8 (7 (2)) = (bp (2) — f (2)) grad g (E) — 
= (2— 7 (z)) grad g (€), 


où Ë est un certain point du segment d’extrémités 14 (z) et f (z). Mais 
z € M, nous avons 3 — y (z) — À (z) @, où À (z) > 0 (voir fig. 122). 
D'autre part, si a grad g (z,) < 0, on a pour un point Ë suffisam- 
ment proche de z, (et il Le sera, si le point z est suffisamment proche 
du point z,) l'inégalité a grad g (£) 0. Aïnsi, 


g(P(z))= (2—7Y(2)) grad g (Ë)= À (2) (a grad g (Ë)) 0, 


et, donc, 1 (z) € Q. La condition 2) est également satisfaite. 
Remarque 34.5. Désignons par Q* un ensemble qui contient 
le point z, et tous les points z € ET" pour lesquels g (z) 0. Il est 
évident que Q* € Q. Alors, dans les conditions du théorème 34.4, 
on peut énoncer l’assertion plus forte: M est la coupole de l’ensemble 
Q% qu point 2. 
En effet, posons 


P* (2) = (2) + (v (c) — 20) a. 


Alors 4% (z) =  (z) + o.,, (z), et donc l’application Ÿ*, de même 
que 1}, satisfait à la condition 4) de la définition 84.1. D'autre part, 
si le point z € M n’est pas sur la demi-droite Z, (y (z) — z,)? > 0, et 


g (D* (z))— g (p (z)) = Gp (z) — y (2)) grad g (Ë) — 
= (y (2) — 2)? (a grad (g (£)) < 0 


(ici & est un certain point du segment qui contient les points (2) 


et 1#* (z)). Par conséquent, g (db* (z)) < g (b (z)) L 0, et donc 
VY (2) € GX. 

Mais si le point z € M est contenu dans la demi-droite /, i.e. z — 
= Z9 + À où À > 0, on a #* (z) — 1 (z) — z et donc également 
pr (2) € Q. 
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Ainsi, dans tous les cas, on a 4* (z) € Q* (pour des points z € M 
suffisamment proches de z,), et la condition 2) est également satis- 
faite. 


Théorème 34.6. Soit Q un ensemble déterminé dans l'espace E" par 
les restrictions (34.1) et supposons qu'au point z0 € Q le système de restrictions (34.1) 
est non dégénéré. Désignons par M l’ensemble de tous les points z € EN pour les- 
quels le vecteur z — z, possède un produit scalaire non positif avec chacun des vecteurs 
(34.4). Alors M est la coupole de l'ensemble Q au point 20. 

Démonstration. Remarquons avant tout que M est l'intersection 
des demi-espaces P;, i € I (z), où P,; est le demi-espace de tous les points z € ET 
pour lesquels (z — z,) grad gî (z0) < 0. Donc, M est un cône convexe de som- 
met z,. Désignons par s le nombre d'indices contenus dans la zone d'activité 
I (z). Pour s = 0, le point z, est un point intérieur de l’ensemble @ et 
l’assertion du théorème est trivialement satisfaite. Nous allons donc supposer 
par la suite que s > 1. 

Supposons, pour fixer les idées, que ce sont les premières s restrictions 
(34.1) qui sont actives au point zo tandis que les autres sont non actives, i.e. { (z)= 


— {1,...,s}. Alors l’ensemble Q est déterminé auprès du point z, par les 
inégalités 
g' (2) < 0, ..., gs (2) < 0, (34.6) 
et le système (34.4) consiste en vecteurs 
grad gô (20), i— 1, ...,5. (34.7) 


Choisissons une demi-droite Z telle que le vecteur unité & (qui possède la même 
direction que cette demi-droite) a un produit scalaire négatif avec chaque 
vecteur (34.7): 


a grad gî(zp) <0, i—14,...,s. 


Pour chaque i = 1, ..., s construisons une application 1; (définie près 
du point z,) de la manière indiquée par la démonstration du théorème 34.4. 
Ainsi, 
W()=z+a(z) a, g'(p; (2) <O0 pour zE P;. 


Désignons par &(z) Le plus grand des nombresos (z), ..., «&, (2). Les 
fonctions @ (z), . .., &, (z) étant continues, la fonction « (z) (définie près du 
point z) est également continue. Posons 


D (2) = z + «à (z) «. 


La fonction 1 (z) est définie près du point z, et satisfait à la condition 1) de la 
définition 34.1 (car les fonctions 4, (z), . . ., 1, (z) satisfont à cette condition). 

Il nous reste à démontrer que l'application w satisfait à la condition 2), 
i. e. que Ÿ (2) € Q pour z € M (si le point z est suffisamment proche de z,). Nous 
avons 


g* (p (2) —gf (bi (2) = (4 (2) — pi (2)) grad gi (E) = (a (2) — 4 (z)) @ grad gi (E), 


où 6 est un certain point du segment qui joint les points 1 (z) et 1, (z). Mais 
a (z) > «&; (z) et & grad gt (£) < 0 (si le point z est suffisamment proche de z). 
Par conséquent, gt (1 (z)) — g° (1; (z)) < 0. Comme ME P;, on a pour cha- 
que i = 1, ..., s la relation (si z € M) 


gt (p (2) & gf (p; (9) < 0. 
Ainsi, si le point z € M est suffisamment proche de z,, alors, pour tous les i € 


€ ZT (z), on à les inégalités g; (1 (z)) < 0 et donc 4 (z) € Q. La condition 2) est 
donc également remplie. 
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Théorème 34.7. Soit Q un ensemble de E°, et M une coupole de l'en- 
semble Q au point Q € Q. Soit, d'autre part, ® : Q —- ET une application conti- 
nue, possédant au point Q une application affine tangente f: MEN AE Enfin, 
supposons que C est un point intérieur du cône f (M) relativement au plan P qui le 
supporte, différent de son sommet Q, = @(Q) = f(Q). Alors, il existe dans E* 
un cône convexe fermé NE f (M) de sommet Q, supporté par le plan P tel que C est 
un point intérieur du cône N et N est la coupole de l’ensemble @ (Q) au point Q:. 


Démonstration. Comme le vecteur e;= CQ, est non nul, on peut 
le compléter par les vecteurs e,, ..., €, pour obtenir une base e,, e:, . .., en 





du plan P, où n — dim P = dimf(M). On peut alors supposer (en faisant 
décroître, s’il le faut, la longueur des vecteurs e,, ..., e, sans changer leur 
direction) que les points À,, A», ..., À, déterminés par les relations 

— 

CA — Ci Co 6° — Cn: 


—> 
CA;=e:;, 2: .…. n, 


appartiennent au cône f (M) (car C € relint MW; fig. 123). 


Evidemment, 
nr: CA 64 LR cc 
ER a 
on a alors (voir (17.3), (17.4)) 
À 1 1 1 
Men Er Pl a erer de rer LS EDR (34.8) 


et le point C appartient donc à l'enveloppe convexe des points Q:, 4,, . .., An. 
Si les points Q:, A1, ..., À, étaient situés dans un plan de dimension n — 1, 
ce plan contiendrait également le point C, ce qui est impossible, les vecteurs 


=> > EG 
Ci=COir ea — CA), …. En —=CAn 


étant linéairement indépendants et donc les points C, @,, 42, .-.., À, ne pou- 
vant être contenus dans un seul plan de dimension n — 1. Ainsi, les points 
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O1» Aus + + An ne peuvent pas être situés dans un même plan de dimension 
n — 1 et sont les sommets d’un simplexe 7 de dimension n. Le point C est donc, 
d’après (34.8), un point intérieur de ce simplexe (voir exemple 25.3). 

Désignons par N le cône convexe formé par toutes les demi-droites issues 
du point Q, et passant par les points du simplexe de dimension n — 11[4,,...,4,] 
(fig. 124). Montrons que ce cône est cherché. 

Mais si tous les points A:, ..., À, appartiennent au cône f (M) de sommet 
@,, on a NE f(M). D'autre part, on a évidemment 7 N. D'où l’on déduit 
que P est le plan qui supporte le cône NW, et que C est un point intérieur du cône NW. 
Il reste à démontrer que W est une coupole de l’ensemble  (Q) au point @.. 

Les points 4,, ..., À, appartenant à l’ensemble f (M), on trouve des 
points B:, ..., B, de l’ensemble M tels que f(B;)= À;, i=1,...,n. 
Désignons par g l’application affine du plan P dans l’espace ÆEf qui envoie res- 
pectivement les points ©, A, ..., À, dans les points Q, B,, ..., B, (voir 





théorème 19.9). Remarquons que les points Q, B;, ..., B, sont les sommets 
d’un simplexe de dimension n de l’espace EP (si ces points étaient situés dans 
un plan de dimension nr — 1, alors les points Q,, À,, ..., An étant les images 
des points ©, B1, ..., B, par l’application affine f seraient, d’après le théorème 
19.3, situés dans un plan de dimension n — 1, ce qui est impossible). Le cône W 
est envoyé par l'application affine g dans le cône formé de toutes les demi-droites 
issues du point © et passant par les points du simplexe [B,, ..., B,l. Ce sim- 
plexe étant contenu dans le cône M, on a g(N)e M. 

Mais si M est la coupole de l’ensemble Q au point ©, il existe une applica- 
tion 4: M -- EP telle que # (4) € Q pour tous les points À € M suffisamment 
proches de Q, et telle que 4 possède l'application identique de l’espace E° pour 
application tangente au point Q@. Par conséquent, d’après le théorème 33.5, l’ap- 
plication 1%, — povdog (définie pour tous les points du cône N suffisamment 
proches du point Q,) possède fo g pour son application tangente au point @:. 


Lorsque 
(fo 8) (Q1) = f (g (Q1)) = f (Q) = Q:, 
(og) (4;) = fe (4i)) = f(B;) = À;i, AE PE n, | 
on peut dire d’après le théorème 19.9 que l'application fog coïncide avec l'ap- 


plication identique de l’espace E”. — 
Ainsi, l’application ,, définie près du sommet du cône NV, a l'application 


identique de l’espace Æ° pour application tangente au point Q.. En plus, nous 
avons, pour tous les points À du cône NW suffisamment proches de ©, les rela- 


tions 
ÿ1 (4) = p (h(g (4))) = p (db (4) € p (Q) 


(où 4’ = g(A)E M). Par conséquent, les conditions 1), 2) indiquées dans la 
définition 34.1 sont satisfaites, et N est donc une coupole de l’ensemble  (Q) 
au point Q.. 
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35. Théorème d’intersection. Nous allons démontrer un théorème 
qui servira de fondement de toute l'exposition ultérieure. L'inter- 
prétation géométrique de ce théorème peut être exposée de la manière 
suivante. 

Soit Q un certain ensemble de l’espace E” et M un cône convexe 
de sommet Q € Q, qui est une coupole de l’ensemble Q au point Q. 
Cela signifie, par définition, qu'il existe une application b M —E" 




















qui satisfait aux conditions 1), 2) de la définition 34.1. Puisque 
l’application identique de l’espace £” est tangente à % au point ©, 
l’ensemble 1 (7) contenu dans Q (d’après la condition 2)) est un 
«cône déformé » de sommet Q qui est « tangent » au cône M au 
point Q (fig. 125). 

Soient maintenant Q,, Q, deux ensembles possédant un point 
commun @ et soient WM,, M, les coupoles de ces ensembles au point ©. 
Supposons que les cônes 7, et M, ne sont pas contenus dans un même 
hyperplan et possèdent une demi-droite commune /, intérieure à cha- 
cun des cônes M,, M, relativement aux plans qui les supportent 
(fig. 126); une telle position des cônes est possible s’ils sont insé- 
parables et au moins un d’entre eux n’est pas un plan. Comme les 
« cônes déformés » 4%, (1Z,) et 4, (12,) (où w,, 1, sont les applications 
correspondantes satisfaisant aux conditions 1), 2) de la définition 
34.1 sont « tangents » aux cônes M, et M, il semble probable que 
W. (M,) et 1, (W,) se coupent le long d’une courbe À, tangente à la 
demi-droite ! au point Q (fig. 127). Par conséquent, on peut trouver 
un point B € À différent de Q et appartenant à la fois aux deux 
« cônes déformés » 11 (MW), 1% (MW). Mais si, (M,) € Q,, 7% (M) € 
æ Q,, on a BE Q, NM Q.. 

Ainsi, si les ensembles Q,, Q, possèdent en un point commun © des 
coupoles M, et M), et les cônes M, et M, sont inséparables, l’un d’entre 
eux n'étant pas un plan, il existe un point B € Q, [\ Q, différent de Q. 
Ceci est essentiellement l’énoncé du théorème 85.1 démontré ci-des- 
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sous pour le cas de deux ensembles. (Il va sans dire que les considé- 
rations intuitives, exposées ci-dessus, ne sont pas une démonstration 
rigoureuse de ce théorème.) 

Remarquons que Ia non-séparabilité des cônes M, et M, est 
une condition essentielle pour la validité de l’assertion indiquée. 
En effet, s’il existe un hyperplan l qui sépare les cônes M, et M), 
alors (même si ces cônes possèdent une demi-droite commune ), 


EX 
4 
UL7// À 


Fig. 127 Fig. 128 






les « cônes déformés » 1, (4Z,) et #, (W,) peuvent se trouver disposés 
de différents côtés de l’hyperplan let donc ne posséder aucun point 
commun différent de Q (fig. 128). 

Les considérations exposées rendent tout à fait évidente la 
signification du théorème 35.1. Mais sa démonstration est assez 
compliquée. On peut donc l’omettre en première lecture. Une 
démonstration plus simple (pour des hypothèses moins générales) est 
donnée dans la remarque 35.2. 

Théorème 35.1. Soient Q,, ..., Q, des ensembles de l’espace 
E" possédant un point commun Q, et soient M,, . .., M, des coupoles 
des ensembles Q.,, ..., Q, au point Q. Si le système des cônes convexes 
M, ..., M, ne possède pas la propriété de séparation, et au moins 
un de ces cônes n’est pas un plan, alors il existe un point B E Q;,f ... 
... A Qzx différent de Q. 


Démonstration. Comme le système de cônes M,,..., M ne 
possède pas la propriété de séparation, il existe, d’après le théorème 32.5, un 
point 

O € (relint M,) N .., N (relint W,;) 


et il existe, en outre, des sous-espaces Z,, . .., L, (dans lesquels se décompose 
en somme directe l’espace ET) tels que le sous-espace L; est contenu dans le 
plan qui supporte le cône M;, quels que soient à Æ j (i, j — 1, ..., k). (Nous 
supposons ici que © est l’origine de l’espace Er, de sorte que chaque plan qui 
passe par © sera un sous-espace.) Remarquons que O -£ Q, car, par hypothèse, 
au moins un des cônes M1, . .., M, n’est pas un plan et pour ce cône le point @ 
sera un point frontière relativement au plan qui supporte le cône. 
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Choisissons maintenant une telle base €, . .., e, de l’espace ET et de tels 
entiers 0 = qo <a 42 Le. LIL = n que les vecteurs 


€ € PR 
Qt 1 qj_at+2 À q; 


forment une base de l’espace L; pour chaque j = 1, ..., k. Ayant choisi cette 
base, nous la garderons fixe jusqu’à la fin de la démonstration. En outre, nous 
conviendrons de considérer la base e,, ..., €, orthonormée (ce qui détermine 
une métrique euclidienne dans l’espace Æ). 

Introduisons maintenant la notion de parallélépipède canonique de dimen- 
sion r dans l’espace E". Pour cela, désignons par %$ l’ensemble des nombres 


r? n=>. H={1} SN=T2.8) 





Fig. 129 


1, ..., n, choisissons un sous-ensemble quelconque H€ S, puis, pour chaque 
i € H un certain nombre at et pour chaque i € S K H deux nombres ai, bi qui 
satisfont à la condition af < bi. Nous appellerons parallélépipède canonique 
l’ensemble de tous les points de l’espace E" dont les coordonnées zx1l, ..., æ" 
dans le système (0”; e,, . .., e,), où O' € En, satisfont aux conditions (fig. 129) : 


at = a pour iC H; 
ai < xt < bi pour iE SX H. 


Si tous les nombres a, bi sont rationnels, nous dirons que le parallélépipède 
canonique considéré est rationnel (dans le système (0’ ; e,, ..., e,)). Le paral- 
lélépipède canonique ainsi construit est l’intérieur d’un polyèdre de dimension 
r (i.e. du parallélépipède fermé de dimension r) dans £”, où r est le nombre 
d'éléments de l’ensemble S X H. 

Soit À un nombre positif. Nous appellerons un parallélépipède canonique 
h-cube de base dans le système de coordonnées (0 ; e,, ..., e,), si pour chaque 
i= 1, ..., n nous avons at — hgt, où g° est un nombre entier et, d'autre part, 
pour chaque i € S X H le nombre bi satisfait à la condition bi= aî+h 
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(fig. 130). On vérifie aisément que tous les h-cubes de base (de dimension 
0, 1,..., n) dans le système (0’; e,, ..., e,) sont disjoints deux à deux et 
eur réunion coïncide avec £". L'ensemble de tous les h-cubes du système (0; 












RRKKS 





__——— _—. 





Fig. 130 Fig. 131 


Eys + «+ En) Sera noté X} (0') et appelé décomposition en cubes correspondant au 

nombre k et au point O'. (Nous soulignons particulièrement la dépendance de Ia 

décomposition en cubes du choix du point O0’, puisque dans nos raisonnements la 

base €,, ..., en sera, comme nous 

rA Ml { SEMNR,  V'avons déjà remarqué, fixe, mais il 

nous faudra nous servir de décomposi- 

tion en cubes obtenus pour différents 
choix de l’origine O’.) 

Démontrons maintenant l’assertion 

suivante. Soient O1, . . ., Oj, des poinis 

de EM tels que toutes les coordonnées du vec- 


teur Fr (O; — O;) ne sont pas entières, 


quels que soient i Æ j (i, j — 1, . . .,k) 

et supposons que pour tout j—=1,...,k 

on a choisi dans la décomposition en 

. cubes K} (O;) un certain h-cube de base 

Fig. 132 R;; aire l'intersection Rules 0 Re, 

si elle est non vide, est un parallélépipède 

canonique de dimension Tec. +FrR —(k—1)n, où r;—dimR;, 

j—=1,...,k (lg. 131). 

En effet, désignons par A; le sous-ensemble de l’ensemble S qui correspond 

au h-cube R;, de sorte que le h-cube R; est déterminé dans le système de coor- 
données (0;; e, ..., €e,) par les relations de la forme 





ri hg; pour iCH;; 
: : ’ | (39.1) 
hq;< x <h(g;+1) pour iES XH;. 


Il est aisé de voir que si deux ensembles quelconques parmi les ensembles 
H,, ..., H, ont une intersection non vide, alors l'intersection R; N . -. MN Re 


est vide. En effet, si par exemple i € H, N\ H,, alors l’équation ri = hgi parti- 
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cipe à la définition du k-cube R, et l'équation x — hq} à la définition du #-cube 
R,. Autrement dit, le k-cube R, est contenu dans l'hyperplan défini dans le 


système de coordonnées (O,; €, - - ., €,) par l'équation x? = hg; et le h-cube R;, 
dans l’hyperplan déterminé dans le système (0:; e1, . .., e,) par l'équation 
ri — hqi (fig. 132). Mais si les nombres qi, q sont entiers, et la i-ème coordon- 


née du vecteur a (O2 — O;) n’est pas entière, ces deux hyperplans sont paral- 


lèles mais ne coïncident pas de sorte que R,fN R,.—=9, et donc R; NN ...fN R1= 9. 





Fig. 133 


Ainsi, si l’intersection R;, f\ ... fN R4 est non vide, tous les ensembles 
H;, ..., H, sont disjoints deux à deux et, par conséquent, l’intersection R:f{ … 
... fN R, est déterminée par un nombre d'équations égal à la quantité d’élé- 
ments dans l’ensemble 


H= HU... U A. 


(Sur la fig. 131 H, = S, H2 = S, H;, = {2}.) En ce qui concerne les autres 
coordonnées (dont les numéros ne sont pas contenus dans l’ensemble F), l'inter- 
section R, NN ... M À, est déterminée par des inégalités de la forme ai < xt < 
< b?. (Ainsi, sur la fig. 131, l'intervalle (al, bh) est l'intersection de 
trois intervalles.) On voit donc que R,/f ... fN\ R, est un parallélépipède cano- 
nique de dimension nr — p, où p est le nombre d'éléments de l’ensemble 7. 
Comme p= pp +...—+ pr, Où p; est la quantité d'éléments de l’ensemble Y;, 
TTL, Ses; de ON à 


dim(R NN... NRj=n—-p=n—-(p +... + pr) = 
= (n—p)+...+(n— p)—(k—1)n= dimR +... 


...t+ dim AR —(k—1)n, 
ce qu'il fallait démontrer. 

Introduisons maintenant la notion de chaîne. A savoir, nous appellerons 
chaîne de dimension r (où r est l’un des nombres 0, 1, ..., n) un ensemble fini 
de parallélépipèdes canoniques écrits l’un après l’autre et liés par des signes +. 
Par exemple, nous écrirons 


tre p,+P,+...+p, 


et nous dirons que Ë” est une chaîne de dimension r formée des parallélé- 
pipèdes P,, P,, ..., P,; canoniques de dimension r. Visuellement, on peut 
s'imaginer une chaîne sous forme de surface « brisée » de dimension r (qui peut 
consister en un certain nombre de morceaux séparés; voir fig. 133). Convenons 
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que chaque parallélépipède qui se rencontre deux fois dans la même chaîne 
peut être éliminé, par exemple, 


P, + Pl; + Ps + P3= Ps + Pa 
Pi + Pa + Pa + Pa = Pi + Pa, 
P,+P,+P;+P,;=0 
(autrement dit, nous considérerons, comme on dit aussi, des chaînes modulo 2). 
Les chaînes de la même dimension peuvent être ajoutées comme des polynômes 
(en éliminant tous les parallélépipèdes qui se rencontrent deux fois). 


La frontière d’un parallélépipède de dimension r est composée de 2r faces 
principales (i. e. de dimension r — 1), et, par conséquent, la frontière de chaque 





Fig. 134 Fig. 135 


parallélépipède canonique P peut s’écrire sous forme de chaîne qui consiste 
en toutes ses faces principales. Convenons de désigner cette chaîne (la frontière 
d'un parallélépipède canonique P) par le symbole dP. Par exemple, sur la fig. 134 


dP=Pi+Pa+Pi+Ps, 
et sur la fig. 135, la frontière dP d’un parallélépipède P s'exprime par la formule 
dP=Pi+P2+P3+Pi+P:+Ps 


Ainsi, nous appellerons bord de tout parallélépipède canonique de dimension r 
Ja chaîne dP de dimension r — 1. 

| On peut maintenant définir le bord d’une chaîne quelconque; à savoir, 
nous appellerons bord de la chaîne de dimension r 


Er = P,+P,+...+P, 
la chaîne de dimension r — 1 
dé" = dP, + dP, +...+ dP,. 


Par exemple, la fig. 136 représente le bord de la chaîne £2 = P,+...+P, 
‘donnée sur la fig. 133. Remarquons que cette définition n’est valable que pour 
r > 0. Pour chaque chaîne de dimension 0 nous conviendrons que le bord est nul. 

Il est clair que, pour cette définition du bord, nous avons la relation suivante 
pour tout couple de chaînes &”, n” de dimension r: 


d (Er + m7) = dEr + dm. 


Voyons en particulier Le cas r = 1, i. e. le cas des chaînes de dimension 1. 
Chaque cube canonique de dimension 1 est un intervalle parallèle à l’un des 
. xes des coordonnées. Sa frontière consiste en deux points; ainsi, sur la 
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fig. 137 nous avons dP — À + B. On en déduit que le bord de toute chaîne de 
dimension 1 est formé d’un nombre pair de parallélépipèdes (points) de dimension 0. 
Soient maintenant O,, ..., O, des points de £7' tels que toutes Les coordon- 


nées du vecteur Z (O0; — Oj) ne sont pas entières, quels que soient i Æ j (i, j — 


= 1, ..., k). Supposons, d’autre part, que r1, ..., r, Sont des nombres en- 
tiers tels que 0 < r; < net Ë; est une chaîne de dimension r; formée de hk-cubes 
de base de la décomposition en cubes K} (0;), j — 1, . .., k. Nous supposerons 
que r+...—+r — (k — 1) n > 0. Choisissons pour chaque j = 1, ..., k 
un certain »-cube R; (de dimension r;) de la chaîne . Alors, en vertu aäc ce que 


rŸ 
| 2 
2 
— P 
VA RE 
À Ê 
rS 7 z’ 
Fig. 136 Fig. 137 


l’on a démontré précédemment, l'intersection R,f\ . .. f\ R}, si elle est non vide, 
est un parallélépipède canonique de dimension r, + ...—+r, — (k —1)n. 
En prenant la somme de tous les parallélépipèdes canoniques ainsi obtenus 
(lorsque R; parcourt tous les k-cubes de base de la chaîne £;, j = 1, ..., k), 
nous obtiendrons une certaine chaîne de dimension r, + ...<+ rs — (k — 1)n, 
qui . appelée intersection des chaînes E,, ..., o et désignée par E; X ... 
4e 2) GB 

Nous aurons maintenant besoin de la formule suivante *) qui donne l’ex- 
pression du bord de la chaîne &, X E, X ... X E: 


d(b1XÉ2X ... X En) = (dE) XÉ2 X ... X En + Es X (dE2) X Es X 
ee X Ent. HE X EX... X (dép). (35.2) 


Il suffit de démontrer la formule (35.2) pour le cas où chacune des chaînes 6; 
est formée d'un seu! k-cube £; — R;, où dim Rj= r; (le cas général de la for- 
mule (35.2) s'obtient par une addition évidente). 

Ainsi , nous devons démontrer la relation 


d(R X Ro X <.. X R) = 
= (dR)X RX... X Rk+R X (Ra) X cos X Rp+... 
ser RC RheX ss. X (dRh), (35.3) 
*) Elle est un cas particulier de la formule de Lefschetz; voir M. Glezerman, 


a Intersections dans les variétés. Uspekhi math. Nauk, 2, n° 1 
. 


296 EXTRÉMUMS DES FONCTIONS (CH. IV 


où À; est un h-cube de base de X} (0j), j — 1, ..., k. Supposons que le k-cube 
R ; est défini dans le système des coordonnées (0; e;,, ..., e,) par les relations 
(35.1). Désignons par o$, ..., 07 les coordonnées du point O; dans le système 
(O; €, . . ., e,). Alors le h-cube R; se détermine dans le système (0 ; e;, ...,e,) 
par les relations 
ti a! pour àiCH';; 
oo pat (35.4) 
aj<axt<a;+h pour iES X H;, 
où a; = hg; + 0 (fig. 138; comparer à la fig. 130). Par conséquent, le parallé- 
lépipède canonique R;,f\ ... f RA est défini dans le système (0; e:, ..., e,) 
par les relations 
ri= a pour GC; j=1,.:.,8R: 
biLzi<ci pour iE€S AH, 


où H = H, U...U Hx et (bi, c) désigne (pour un numéro fixe donné i € 
€ SX H) l'intersection de tous les intervalles (a, a; + h), j = 1, ..., k. 


(35.5) 


Ÿ D 
T'À #={1}, 42 





Fig. 138 Fig. 139 


Remarquons que bî est (pour chaque à € S X H) l'extrémité d'un seul des 
intervalles (a;, af + h), j = 1, ..., k (la même chose est vraie pour c’). Cela 


découle de la relation 
0 — 0! 
ajÿ—a;=h (g;—q)+(0;—0)=h («aan + ; Æ 0, 





i 
0; —0; 





vérifiée par le fait que le nombre g — q est entier, tandis que le nombre 


qui dépend du choix des points O,, ..., O, ne peut pas être entier. 
Considérons le j-ème terme R1 X ... X Rj1 X (dR;) X Ris X .. 
... X Ry du deuxième membre de la relation (35.3) que nous démontrons. La 
chaîne dR;, i. e. le bord du k-cube R;, peut être écrite de la manière suivante 
(fig. 139). On choisit un certain numéro à € S X H; et l’on considère le h-cube 
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canonique déterminé dans le système (0 ; e,, ..., e,) par les relations 
ri a? pour iCH;; 
tic pour ii; (35.6} 
ai<ri<ai+h pour iCSXH;,iZÆio 


où c est un des nombres aÿ° ou a + h. Chaque tel cube est une face principale 
du cube R;, et l’on peut décrire de cette manière toutes les faces principales du 


cube R; (en faisant parcourir l’ensemble S X A; par à et en donnant toujours 
au nombre c les valeurs at» 450 + h). 


Soit Rj une des faces principales du cube R; (déterminée par les rela- 
tions (35.6)). Trouvons l'intersection R; X ... X Rj1 X RKX Riu X ...… 


ee. X Rp. Pour cela désignons par H; 
l’ensemble contenant tous où éléments D'À JL MED M =}, = 2Eh, 
de A; et le nombre i,. Le cube R; se déter- 

mine par les relations de la forme 


zi— const pour iCH;, 
ai <a <ai+h pour i€ SH. 


Par conséquent, si les ensembles H,, ..., 
H;-1, Hj, His, . . ., H3 sont disjoints deux 
à deux, l'intersection R, f ... NR; N… 
... N R4 est vide. Autrement dit, si à, 
appartient à l’un des ensembles Æ,, ..., 
Hj1, His, . . ., Hy, alors l'intersection 
1 er 5 X ++. X Rg est nulle 
(fig. 140; comparer à la fig. 131). Donc, 
il suffit de considérer seulement le cas 
ES H. _ a 
Ainsi, le deuxième membre de la 18: 
relation (35.3) est une somme de termes 
de la forme R; X ... X RjX ... X Ry, où R; est un cube (35.6), et i, parcourt. 
l'ensemble S X H; d'autre part, j = À, ..., k, et le nombre c dans les rela- 


tions (35.6) prend les valeurs aie, aie + h. 





Considérons le cube R; déterminé par les relations (35.6), où c— a. Mais: 
si l'intervalle (b'0, ce) est l'intersection de tous les intervalles (a?, ai + h), 
j=1,...,k, on à aÿ° < b"0, Il est facile de comprendre que dans le cas où 
cette inégalité est stricte : ao < bo (pour un numéro j considéré) l’intersection 
R;,/f ... NA R;fN ... f RK est vide. En effet, b°0 est un des nombres a, 
..., an. Comme ao < p'o, on a b°0 — an, où Zj. Mais l'égalité z0 — ai 
participe à la définition du cube (35.6), tandis que l'inégalité a)0 <r0 < 
<aÿ +h, ie. x° >", participe à la définition du cube Ry Puisque le. 
système de relations x°° — a, r0 > p°0 pour ao < bio est évidemment incom- 
patible (fig. 141), l'intersection R;,f1 ... NRiN.../NRz est vide dans ce cas. 

Ainsi, si dans (35.6) c — ai, alors l'intersection ÆR;f\... MAR ss 
... MR; sera non nulle sous la seule condition b°° — aÿ. Il est facile de com- 
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prendre quelle est la valeur de cette intersection dans le cas où cette égalité 
est vérifiée. En effet, le cube R; s'obtient en remplaçant dans le système de rela- 


tions qui définissent le cube R; (voir (35.4)), l'inégalité ai <r0 < ah par 
l'égalité 20 — pi0 — a. Ainsi, l'intersection s'obtient en remplaçant, 
dans le système de relations (35.5) qui définit le parallélépipède R;fN . .. NRy: 
l'inégalité b°0 < x0 € co par l'égalité x°° = b"0. Donc, si l’on a la condition 
b9— a, l'intersection Ri X ... X Ri X ... X Ry est la face principale 


So (b0) du parallélépipède R,fi...f\Rx définie par la condition z°°— bio 
(fig. 142). 


D'une manière analogue, si l’on a c — ai + hk dans les relations (35.6), 
l'intersection R;, X ... X R' X R, sera non nulle à condition de «= a®+h 


TA =, j 1, N={2}, 2 7=5? 





Fig. 442 


et représentera, dans ce cas, la face principale s'o (co) du parallélépipède R;, MN ... 
... Rx déterminée par la condition x! = cî0, 

Fixons maïntenant un numéro i, € SH. Alors, comme nous savons, il 
existe seulement une valeur de j (— 1, ..., k) pour laquelle ai = 


— b"® (comparer à la fig. 131). Par conséquent, parmi tous les termes de la 
forme R, X ...X R; X...X R; du deuxième membre de (35.3) pour les- 


de 5, Sn NE : à 
quels i= is etc— af (i—=1,...,k),un seul sera non nul, et d’après 


ce que l’on vient de dire, ce terme non nul sera égal à so (b). Exactement de la 
mème manière, parmi tous les termes du deuxième membre de (35.3) pour les- 
quels i= is et c— a+h (j=1,...,k), un seul sera non nul et ce 
terme non nul sera égal à S°° (c"°). Ainsi, le deuxième membre de la relation (35.3) 
est égal à Z (S°0 (b°0) + 5° (c°)), où la somme est calculée sur tous les numéros 
io € S NX À. Mais c’est justement le bord du parallélépipède R;, X ... X Ry. 
Ainsi, la relation (35.3) (et avec elle (35.2)) est entièrement démontrée. 

Avant de passer à la démonstration même du théorème 35.1 nous énoncerons 
une autre assertion concernant les chaînes. Pour sa formulation, introduisons 
la notion de réalisation d'une chaîne. Soit Ër — P, + ...-LP, une certaine chaîne 
de dimension r. Nous appellerons réalisation de cette chaîne la réunion de tous 


$ 9] THÉORÈMES D'EXISTENCE 299 


les parallélépipèdes P,, ..., P, et de toutes leurs faces (i.e. la réunion des 
adhérences des parallélépipèdes P,, ..., P,). La réalisation de la chaîne Ër sera 
désignée par | Ër | ; c’est un ensemble fermé borné de l’espace E7 (cf. fig. 133). 
Remarquons que pour chaque chaîne Ër on a la relation | dr | | &r | (cf. 
fig. 136). L’assertion nécessaire peut maintenant être énoncée de la manière 
suivante. 

Soit K}(0') une certaine décomposition en cubes de l’espace E" et ÊT une chaîne 
de dimension r composée de cubes de cette décomposition en cubes. Désignons par 


YV(=R V/n) le diamètre des cubes de dimension n de la décomposition en cubes con- 
sidéré. Soit ensuite f: |6" | — E" une application continue et d un nombre tel que 
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Fig. 143 Fig. 144 Fig. 145 


© (x, f (x)) < d pour tout point x € | Ër |. IL existe alors dans K} (0') des chaînes 

r#, Ôr, n’ telles que la chaîne Ür*1 est contenue dans le (d + y}-voisinage de l’en- 
semble | ÊT|, la chaîne (T dans le y-voisinage de l’ensemble f (| Er |), Ja chaîne n° 
dans le (d + y)-voisinage de l’ensemble | dËr | et l’on a les relations 


déni Ertertnr,  dér= dr + dr. 


La démonstration de cette assertion (que nous appellerons par la suite 
théorème d’approximation) s'effectue par les méthodes de la topologie algébrique. 
Pour tout point x € | êr | désignons par ®, (x) le point #x + (1 — #) f (x) (fig. 143). 
Alors D,, 0 < 1 < 1 est une déformation continue de l’ensemble | £" | qui s’ef- 
fectue dans le d-voisinage de l’ensemble | £7 |, tandis que la déformation de 
l’ensemble | dé” | & | Ë" | dans le d-voisinage de l’ensemble | dër |. Cette défor- 
mation transforme la chaîne £T en une chaîne continue D (Ër) de dimension r + 1 
(appelée également chaîne de déformation), et la chaîne dËr est transformée en 
une chaîne continue D (dË£”) de dimension r et l’on a 


d(D (#r)) = 87 + f (87) + D (dër), 


où f(é") est une chaîne continue de dimension r qui est l’image de la chaîne 
ET par l'application j (fig. 144). En appliquant aux chaînes D (Er), f (Er), D (dë”) 
le théorème de l’approximation cellulaire (dans le cas où les cellules envisagées 
de l’espace E7 sont les cubes de X} (0’)), nous obtiendrons les chaînes Cr#, 
Êr, n’ qui satisfont aux conditions demandées (fig. 445). Pour le théorème de 
l’approximation cellulaire et les autres détails de cette démonstration, nous 
renvoyons le lecteur au cours de topologie algébrique. 

Passons maintenant directement à la démonstration du théorème 35.1. 
Posons r — n — dim Z;, i = 1, ..., k. Alors 


toc tiR—(k—{)n=n—{(dimz, +... + dim L)= 0. 
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Choisissons ensuite des points O,, ..., ©, tels que le point O; possède dans le 


système (0; e;,..., en) des coordonnées (oi su o$) qui satisfont aux deux 
conditions suivantes : 

1) 0j = 0 pour i= ga +1, ga +2, ..., 955 j—= 1, ...,k (ie. le 
point O; a des coordonnées nulles pour les axes contenus dans le plan Z;); 

2) les nombres o; — o, pour j -£ 1 sont irrationnels (i — 1, ..., n;j,l1= 
= 4,..., k). Par exemple, on peut obtenir de tels points en prenant tous les 


nombres GE égaux à 0 pour i — qj + 1, Qi ns es dires 
et en posant tous les autres nombres 0; égaux à TH, Mo, Has ee +) TNA N dans 
un ordre quelconque. | | 

? ? 

0; — 0 

h 

pas entier quels que soient jÆl(i—=1,...,n; j, 1— 1,..., k), et 
ceci nous permet, pour tout k rationnel, d'appliquer aux décompositions en 
cubes K} (O:), ..., Kn (O2) la formule (35.2). D'autre part, grâce à ce choix 
de points O:, ..., O,, les équations 


ai=0 pour i=g;1+1, qi 1+2, ...,0q; 


(où j est un des nombres 1, . .., k) déterminent dans le système (0;; e3, ... 
++, €n) Un plan G; qui passe par le point O (i. e. est un sous-espace) et a pour 
dimension n — (q;j — qj_1) — n — dim ZL;—r;. D'autre part, le sous-espace 
G; contient le sous-espace Z; pour chaque i = j et se décompose donc en une 
somme directe de sous-espaces Li, ..., Li, L;i1, . . ., L,. Par conséquent, 
G; est contenu dans le plan qui supporte le cône M;. 

Soit P un ensemble de l’espace E". Nous désignerons par Us(P) la réunion 
de toutes les boules de rayon 6 et de centres dans des points de l’ensemble P; 
autrement dit, Us (P) est le ô-voisinage de l’ensemble P (dans l’espace ET). 

Choisissons pour chaque j — 1, ..., k un parallélépipède canonique P; 
supporté par le plan G; et contenant le point O. Aussi supposons-nous que P;c M; 


Grâce à un tel choix des points O,, ..., O4, le nombre 





ne ser& 


et Qé P;, où P; = P; U (rel ir P;) est le parallélépipède fermé correspondant. 
Puisque l'intersection G, N ... N G, consiste en un seul point O, l'intersection 
P;1N.../fN\2P, ne contient que ce point O qui est un point intérieur de chacun 


des polyèdres P; relativement au plan G; qui le supporte. On en déduit que 
l'intersection 


(rel fr P;N (N.F;) 
11 
est vide pour tout j = 1, ..., k. Il existe donc un tel nombre Ô > 0 que pour 
chaque j — 1, ..., k les ensembles U,5 (rel fr P;) et [} Us (P;) ont une inter- 


i#3 
section vide. D'autre part, on peut supposer en plus (en diminuant, s’il le faut, 


le nombre 6) que l’ensemble U, (P;) ne contient pas le point Q. 

Comme M; est une coupole de l’ensemble Q; au point ©, il existe une appli- 
cation #; définie dans un voisinage du sommet Q du cône W; et satisfaisant 
aux conditions 1), 2) de la définition 34.1. 

Le domaine de définition de l'application 1; sera désigné par Mi. Ainsi, 
tous les points du cône M; suifisamment proches du point Q appartiennent à 
l’ensemble M. 

Désignons maintenant par g, l’homothétie de centre Q et de coefficient 
£ > 0. L'homothétie g, envoie l’ensemble U,, (P) dans un 4ôe-voisinage de 


l’ensemble g,(P), i.e. 
ge (Us (P)) = Uige (ge (P)). 
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On en déduit que pour tout j = 1, ..., k les ensembles U,5, (rel fr g, (P ;)) 
et [R Use (ge (P;))ont une intersection vide ; en outre, l’ensemble U, (ge (P;)) 


ne ontioit pas le point Q. 
Lorsque 


Ÿ; (4) = À + 00 (4), ie. p (4, À (4)) = 09 (4) (35.7) 


il existe un tel & > O0 que pour tous les j = 1, ., k la condition 4 € g, (P;) 
implique l'inégalité 


p (4, D; (4) <6e (4€ ge (P;)). (35.8) 
Nous choisirons donc un tel nombre & et le ee invariant. 
Le parallélépipède canonique g, (P;) (où j — 1, ., k) se définit dans le 
système (O0 ; ex, ..., €,) par les relations de la forme 
zi= ai pour i=gj-1t 1, ja 2, ..., qj; (35.9) 
ai <ri< fi pour les autres valeurs de à. 
L’intersection g, (P:) N . fl (P3) consiste en ce seul point qui a les coor- 
données (al, ..., a) dans le système (0 ; e,, ..., e,). Si l’on change un peu 


les aombres a, pi dans les relations (35.9), on oDtépd a un nouveau parallé- 


lépipède canonique Pÿ , < proche » du parallélépipède g, (P ;). Effectuons le change- 

ment des nombres a, B; dans les relations (35.9) de manière à obtenir des paral- 

lélépipèdes P#, ..., PX « proches» des parallélépipèdes g, (P:), ..., ge (P3) 
et possédant les propriétés : 

a) le parallélépipède Pi, est rationnel dans le système (0;; e;, ..., e,); 

b) le parallélépipède P; est contenu dans le ôe-voisinage de l’ensemble 


g. (P;) et sa frontière rel fr P; est contenue dans le ôe-voisinage de l’ensemble 


rel fr ge (P;); 

c) l'intersection P* N ... f] PX est non vide (et par conséquent, composée 
d'un seul point). 

Il est évident que toutes ces conditions seront satisfaites si le changement 
des nombres a; 8 dans les relations (35.9) effectué en passant du parallélépi- 


pède ge (P;) au parallélépipède P? est suffisamment petit. 

Comme PŸ est (pour chaque j = 1, , k) un parallélépipède rationnel 
dans le système Or Crée us éuh existe un nombre rationnel k* tel que Île 
parallélépipède PŸ est entièrement formé de k*-cubes de base de X}+ (0;) et 


que la même propriété est satisfaite pour rel îr Pi. Il est évident que pour tout 
entier naturel P,. le nombre h — h*/p possède la même propriété, i.e. chacun 


des ensembles Pi , rel fr P; est la réunion d’un nombre fini de k-cubes de base 
de X} (0j), j — , k. Ainsi, il existe un nombre k aussi petit que l’on veut, 


qui possède la sa suivante: chacun des ensembles PŸ, rel fr PŸ est la 
réunion d’un nombre fini de h-cubes de base de la décomposition en cubes 
K} (0j), j= 1, 

Nous démontrerons maintenant que l'intersection 


a (ge (P1)) NN... 1 Vn (ge (Px)) (39.10) 


est non vide. Supposons, au contraire, que l'intersection (35.10) est vide; il 
existe alors un nombre y > 0 tel que l’intersection 


U» (Pa (ge (P 1) NN... NU (Pa (ge (Px))) (39.11) 
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sera également vide. Il est à supposer que y << ôe. Choisissons oo un 


h>0 tel que » Vn <7y et de sorte que chacun des ensembles PŸ, relfr P? 
soit la réunion d’un nombre fini de k-cubes de base de X}, (0;), j = 1, PRE 2 


La relation h |/n <7y signifie que le diamètre de chacun des hk-cubes base 
de X} (0j) est inférieur à Y. 


Pour tout point À € P; désignons par p; (4) le point du parallélépipède 
Le (P;) le plus proche de A. D'après le théorème 29.5, l'application ;: Pi —+ 
— Le e(Pn) est bien définie, et comme on le voit, continue; pour tout point 
A € Pj on a la relation p (A, æ; (4)) < ôe (voir condition b) de la _page 301). 
En vertu de (35.8), nous déduisons alors que pour tout point À € P; on a la 
relation 
p (4, ; (p; (4))) < p (4, @; (4)) + p (p; (4); D; (p; (A))) < Ôe + de = 20e. 


Ainsi, l'application f; = 4;c®; définie et continue sur le parallélépipède Pÿ 
possède la propriété 


o (4, f; (A) < 26e; AGP, j—1, ..., k. (35.12) 
Désignons par &; la chaîne de dimension r; qui consiste en tous les cubes de 
dimension r; de > Kh (O;) contenus dans le parallélépipède Pi, j= 1, FRE à 


Ainsi, | £5| = P}, | dé; | = rel fr Pÿ. En appliquant à la chaîne Ë; et à l'appli- 
cation Ti + théorème d° approximation, énoncé à la page 299, et en prenant en 
considération les relations (35.12) et y < Ôe, nous o tiendrons, dans la décom- 


no en cubes X} (0;), une chaîne {* de dimension r; + 1 et des chaînes 
, n; de dimension r; telles que 


LÉ IC Vase (ED = Use (P5) € Uuse (ge (Pj)), 
eV (5 UE D) CU (bi (ge(P 5) € Use (ge (Pj)), 
ini Use (| dé;|) = Us (relir Pÿ) C Uoe (relir ge (P)), 
| dé;|=relfr P; © Use (relfr ge (P;)) 


(voir condition b) de la page 301 et la relation (35.8)) et telles que les 1c1ations 
suivantes sont satisfaites : 


df=E;tt;tns déj=dE;tdns, j—1,...,k. 
Considérons la chaîne 
h=UX... XCGAXEÉEXEHX... XÈm j=l ..., ke 


Cette chaîne est bien définie en vertu du choix des décompositions en cubes 
K} (0j), j = 1, ..., k; elle est de dimension 


dim Aj=ri+...<Lrina+(r; +0) +rjua+ ra (k—1) n=f. 


D'après la formule (35.2), le bord de la chaîne À; est de la forme suivante 


3-1 
= (xd x...XÉX..)H(.. xd x ...)+ 
i—=1 


HD Cextrexaix (35.13) 
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où les points de suspension désignent des termes sous-entendus (qui, devant 
LŸ, sont de la forme & , et après £* de la forme Ë ). Considérons dans la première 
somme le terme ... X dd, X ...X ÉNCisS où plus en détail, 


Gr NAN GUN CN NAN CI NES eue CEE. (09214) 


Mais si chacune des chaînes Ë6;, Cr. £, est contenue dans Use (ge (P;)), et la 


chaîne dé, = dé, + dn, dans Us, (relfr g, (P;)), on peut déduire que la chaîne 
(35.14) est contenue dans l’ensemble 


Uice (relfr ge (P;))N A Use (&e (P1))). 


Comme cette intersection est vide par construction, la chaîne (35.14) est nulle. 
Par des considérations analogues, on voit que chaque terme de la deuxième som- 
me qui se trouve dans le deuxième membre de (35.13) est nul. Ainsi, la formu- 
le (35.13) se réduit à 


Ne NCAA KEANE: 


En se rappelant la relation déÿ — 6; + éj5 + n; on obtient 


di se CIAN EN NE EUC EX 
XOX EX. XEROX... XÉnaXnX Em1X ... X Ep. 


Le dernier terme du deuxième membre est ici égal à O0 (pour les mêmes raisons 
qu'avant), et donc 


AN CIN es NCA NCEIX RS PT PUS UT DD TS 


Ecrivons toutes ces relations pour j = 1, ..., k et additionnons toutes les 
égalités ainsi obtenues ; nous aurons alors (en nous servant du fait que les termes 
qui se rencontrent deux fois dans une somme de chaînes peuvent être éliminés): 


PE PE D 


Rappelons-nous maintenant que | C; | U, (1; (ge (Pj))), j= 1, ...,k, 
et, par conséquent, la réalisation de la chaîne &, X ... X ©, est contenue dans 
l’ensemble (35.11). Maïs, par hypothèse, l’ensemble (35.11) est vide, alors on 
a GX... X Er = 0. Par conséquent 


dt... +h)= & X ... X Ëp 


Mais la chaîne E, X ... X £, consiste en un seul point, puisque l’inter- 
section PT NN ... f\ P% est formée d’un seul point. Nous avons donc démontré 
que le bord d’une chaîne À, + ... + À, de dimension un est composé d’un seul 
point, quoique nous sachions que le bord de toute chaîne de dimension un doit 
contenir un nombre p a i r de points. La contradiction obtenue nous montre que 
l'intersection (35.10) est non vide. 

Soit B un point quelconque de l’ensemble (35.10). Comme, d’après (35.8), 
nous avons 


B € a (ge (P1)) CUse (ge (P1)) et  Q € Ube (ge (P4));, 


nous concluons que B -£ Q. D'autre part, pour tout j — 1, ..., k, nous avons 
BE; (ge PC; (M) CR; 
et, par conséquent, B € Q, N ... N Q,. Ainsi, le point B est le point cherché. 
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Remarque 35.2. On peut proposer une autre démonstra- 
tion, considérablement plus simple, du théorème 35.1, à condition 
toutefois d’exiger la condition supplémentaire suivante: les appli- 
cations 4W,, . .., 4 (qui montrent que M,, ..., M, sont des cou- 
poles des ensembles Q,, ..., Q,) sont définies dans un certain 
voisinage du point © et sont des applications différentiables. 

Supposons toujours que © est le point intérieur commun des 
cônes M,, ..., M,. Désignons par N,, ..., N, les plans qui 
supportent les cônes M,, ..., M,. Choisissons des boules ouvertes 

1, + - +, E, de centre © dans les plans N,, ..., N,, telles que F; 
est contenue dans le domaine de définition de l’application w;, à — 
— 1, ..., k. Alors 1; (£;) est une variété différentiable (de dimen- 
sion dim V;) dans l’espace E”, qui passe par le point Q et possède 
en ce point le plan tangent NV, (i — 1, ..., k). 

Démontrons que pour tout j — 1, ..., k l'intersection 1, (Æ,) 

.. NA vw; (£;) est, auprès du point ©Q, une variété différentiable 
qui possède en ce point le plan tangent WN,fN .../f}W;. Pour 
j = 1, cette assertion est valable. Supposons qu’elle est vraie pour 
un certain j  k et démontrons sa validité pour le nombre j + 1, 
i.e. montrons que V1 (£:)N ... AN D; (E;)N P;r1 (Er) est une 
variété différentiable possédant au point Q le plan tangent N,/f 

.N Wifi Njr1 Comme 


Wa CE) NN DE) N Dia Ejan) = (hi (EN... 0 Dj (EE) N Din (Ej+4), 


Vi (Æ1) N ... NV; (E;) et 41 (E;+1) sont, près du point Q, des 
variétés différentiables possédant en ce point des plans tangents 
NN... .N Wet N;4,,il suffit donc de démontrer que W,/f 
...f\ Wet W;,, ne sont pas situés dans un même hyperplan (voir 
théorème 33.12). Mais ceci découle directement du fait que ZL,; & 
NN... NN; pou i=j+1,...,k et L; CE N;4, pour 
i—=1,...,j (où L,, ..., L, sont les sous-espaces construits au 
début de la démonstration du théorème 35.1; page 290). Ainsi, 
notre assertion est démontrée pour tous Îles nombres ; 1,  k. 
En particulier, pour j — k, nous voyons que _ (E) A | 

. N Vz (Ex) est une variété différentiable dans un voisinage du 
point ©, possédant en ce point le plan tangent N,f ...f V,. 

Comme OEN,N ...fNV,, il existe une courbe À sur la 
variété 4, (Æ,)N ... MN Vz (Æ;) issue du point Q et ayant er ce 


point Q0 comme vecteur tangent. 

L'application 4;: £; 1%; (Æ;) est bijective (si la boule Æ'; est 
suffisamment _petite), i.e. il existe une application p;:%; (£;) +—F; 
inverse à 4;. Cela signifie que ; (@; (x)) = x pour tout point 
x Ev; (£;), et l'application p;, de même que#;, possède l’application 
identique pour application tangente au point Q. Par conséquent, 
la courbe ; (A) contenue dans la boule Æ; a pour vecteur tangent 
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au point © le vecteur Q0. Comme © est un point intérieur du 
cône M; relativement au plan qui le supporte, on peut trouver sur 
la courbe ; (A) un tel point C;, que la partie de cette courbe entre 
le point Q et le point C'; appartient entièrement à M; (fig. 146). 
Par conséquent, toute la partie de la courbe #; (; (A)) = À du 
point © au point B; = 1; (C;) appartient entièrement à l’ensemble 
VW, M;N E)<Q;. Et l’on a dans ce cas B; 5 Q, puisque l’appli- 
cation 1; est bijective. Cette situation a donc lieu pour tout j — 
= 1, ..., k. Ainsi, la partie de la courbe À du point Q jusqu’à un 


4 Alt 1) 





certain point B (différent de Q) est entièrement contenue dans l’en- 
semble Q,N .../f Q:, d’où l’on déduit la validité du théorè- 
me 39.1. 

Si l’on s’en tient à cette variante de la démonstration (i.e. avec 
l'hypothèse supplémentaire de différentiabilité des 
applications W,, . .., w, dans le théorème 35.1), il faudra se limiter 
à des ensembles Q; et à des coupoles M; de ces ensembles pour les- 
quels il existe une application différentiable #; qui 
satisfait aux conditions 1), 2) de la définition 34.1. L'exemple ci-des- 
sous nous montre qu'une application différentiable 1; de la forme 
voulue n'existe pas toujours, i.e. la démonstration donnée dans 
cette remarque, si elle est bien plus simple, ne donne qu’un résultat 
plus faible que le théorème 85.1. 

Exemple 85.8. Construisons sur le plan x, y une ligne poly- 


gonale infinie A54:4243 ... de sommets 
1 { | 
A= (=, = i 0, À, RER 


En ajoutant à cette ligne le point Q (0, 0), on obtient ainsi un en- 
semble fermé du plan noté Q (fig. 147). Désignons par M la demi- 
droite non négative et par 1 la projection du segment [0, 1] de l’axe 
des abscisses sur l’ensemble Q parallèlement à l’axe des ordonnées. 


20—01208 
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Cette application 14 satisfait aux conditions 1), 2) de la définition 
34.1, i.e. M est une coupole de l’ensemble Q au point @. Il est aisé 
de voir qu’il n’existe pas d'application différentiable # 
qui possède la propriété désirée. 


$ 10. Critères d’extrémum 


36. Condition nécessaire d’extrémum d’une fonction. À présent, 
nous allons énoncer et démontrer une condition nécessaire d’extré- 


mum de fonctions beaucoup plus générale (i.e. ayant un domaine 
d’application beaucoup plus 


vaste) et beaucoup plus forte 
7 (i.e. exigeant un plus grand nom- 
D M, bre de conditions) que la condi- 
Z tion du n° 7. Par ailleurs, la 
A) 717 
y 


condition imposée possède en 

plus l’avantage d’être, en tout 

a cas par sa forme, universelle 

7 Ê2 dans le sens qu’elle s’énonce de 

la même manière pour 

Fig. 148 tout point du domaine de défi- 

nition de la fonction, tandis que 

la méthode du n° 7 nécessitait la considération séparée des points 

situés à l’intérieur du « polyèdre courbe » ou sur ses faces de diffé- 

rentes dimensions. 

Soit M un cône convexe de sommet au point z, situé dans l’espace 

ET et soit 82 — {6z!, ..., Ôz"} un vecteur de l’espace £”. Nous 

dirons que la direction du vecteur 8£ appartient au cône M, s’il existe 

un point z € M tel que le vecteur z — z, est égal à 84 (fig. 148). 

Théorème 36.1. Soient Q,, ..., Q, des ensembles de l’espace 

ET. Soit ensuite F° (z) une fonction régulière, définie sur un certain 

ensemble ouvert de l'espace E" qui contient l'ensemble Z = Q, {NN ... 

... f\ Q,. Posons le problème suivant: trouver un point dans lequel 

la restriction de la fonction F9 sur l’ensemble ZX atteint sa valeur mini- 

male. Soient z9 € 2 et M; la coupole de l’ensemble Q; au point 2, 

i = 1, ..., l. Pour que le point z, donne la solution du problème 
posé, i.e. pour que l’on ait la relation 


F° (20) < F°(z) pour 2€ 2, 


il est nécessaire qu’il existe un nombre 1, et des vecteurs @, . . ., @r 
tels que la direction du vecteur a; appartient au cône dual D (A1;), 
i — 1, ..., 1, et l’on a les conditions suivantes: 

(œ) Po < 0; 

(B) o grad F° (20) = &1 + @o . .. + &:; 

(y) si W, = 0, au moins un des vecteurs @;, &2:, . . ., @ est non 
nul. 
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Si l’on pose le problème du maximum (au lieu du minimum) de 
la fonction F9 sur l’ensemble Z, il faut remplacer le signe de l’inéga- 
lité dans (x) par le signe opposé *). 

Démonstration. Si grad F°(z,) — 0, alors, en posant 
Vo = —1, A = Ge = ... = 43 = 0, nous obtiendrons des valeurs 
pour Vos Aus - - ., @ qui satisfont à toutes les conditions (œx)-(y) 
(indépendamment du fait que la fonction F° (z) atteint ou non son 
minimum au point Z,). Ainsi, pour grad F° (25) = 0, l’assertion du 
théorème est trivialement vérifiée. Nous supposerons donc par Ia 
suite que grad F° (z,) 0. 

Désignons par Q* l’ensemble qui contient le point z, et tous 
les points z € E" pour lesquels la fonction g (z) — F° (z) — F° (z,) 
est négative (i.e. F0 (z) < F0 (z,)). Notons, d’autre part, M* Île 
demi-espace formé de tous les points 32€ Æ" pour lesquels 
(z — 20) grad g (z9) L'O (ou, ce qui revient au même, (z — 2) 
grad F0 (29) Z 0). D'après la remarque 34.5, l’ensemble M* est 
une coupole de l’ensemble Q* au point 2,. 

Démontrons que le système de cônes M, M,, ..., M, à som- 
met commun z, possède dans £” la propriété de séparation. En ef- 
fet, supposons que ce système ne possède pas la propriété de sépara- 
tion. Alors, en vertu du théorème 35.1, il existe un point z, € Q*/f 
N Q,N ...fN Q, différent de z, (remarquons que M* est un demi- 
espace, i.e. M* n’est pas un plan). Comme z, € Q* et z,  Z9, on 
a g.(z) < 0, i.e. F0 (z,) < F9 (z5). Ainsi, nous avons trouvé un tel 
point z € 2 que F0 (z,) < F° (3,5). Mais ceci contredit le fait que 
la fonction F° restreinte à ZX atteint au point z, sa valeur minimale. 
La contradiction obtenue montre donc que le système de cônes 
M*, M,, ..., M, possède la propriété de séparation. 

D'après le théorème 32.2, il existe des vecteurs a*, «a;,; . .., @: 
dont les directions appartiennent respectivement aux cônes 
D (M*), D (M,;), ..., D (M;), et au moins un de ses vecteurs est 


non nul, alors 
a +a+...+ a; = 0. 


Comme M est le demi-espace déterminé par l'inégalité (z — z,) X 
X grad F° (29) < 0,ona a* — —1, grad F° (z,), où 1, & 0. Il est 
évident que les valeurs 1,, &,, . .., &,; sont les valeurs cherchées. 

Le cas du problème du maximum de la fonction Æ (2) 
se réduit directement au cas considéré. Il suffit d'étudier le problème 


du minimum de la fonction — F° (2;). 
Théorème 36.2. Soit Q’ l’ensemble déterminé dans l'espace 
E" des variables z!, ..., z" par les équations 
F1 (2) = 0, ..., FÀ(z) = 0; (36.1) 


__.*) Cette remarque (concernant le remplacement de l'inégalité dans («) par 
l'inégalité opposée quand on passe au problème du maximum) se rapporte tout 
aussi bien à tous les autres théorèmes de cette section. 


20* 
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et Q°" l'ensemble déterminé par les inégalités 
f (9 < 0, ..., ff(z) < 0, (36.2) 


et enfin Q,, ..., Q, des ensembles de l'espace E". Supposons, en 
outre, que F9 (z) est une fonction régulière, définie sur un ensemble 
ouvert de l'espace E" contenant l’ensemble Z = Q'fN Q”N Q,fh . 

N @,. Posons le problème suivant: trouver un point dans lequel 
la fonction F9, restreinte à l’ensemble Z, atteint sa valeur minimale. 
Soit z, € 2 et M; la coupole de l’ensemble Q, au point zp,i — 1, ...,l. 
Par T (29) désignons la zone d'activité du point z,. Pour que le point z 
donne une solution du problème posé, i.e. pour que l’on ait la relation 


F° (20) < F° (2) pour 7€, 


il est nécessaire qu’il existe des nombres %,, V1, . . ., V4 et des vecteurs 
@1, -.., ai dont les directions appartiennent respectivement aux 
cônes duaux D (M,;), ..., D (M;) et des nombres non positifs À;, j € 
€ I (zo), tels que l’on a les conditions suivantes: 


(œ) YO; 
k 
(B) 2 d, grad F® (20) + F2 À; grad f? (20) = @i +... +; 


I (20) 
(y) si tous les nombres %Ÿo, si ..., Ÿr ét Àj, j ET (20) sont nuls, 
alors au moins un des vecteurs @;, . .., @, est non nul. 
Démonstration. Désignons par Q; l'hypersurface déter- 
minée dans Æ" par l'équation F°(z) — 0 et par Q; l’ensemble 


défini dans £" par la restriction f? (z) < O(i —1, ..., k, L € I (Z)). 
Notons que si l’on a grad F° (z,) — 0 pour un certain i — «&, alors, 
en posant Ÿ, — —1 et en prenant les autres valeurs 1};, À;, az toutes 


nulles, les conditions du théorème seront satisfaites (indépendam- 
ment du fait que la fonction F° (z) atteint où non son minimum au 
Pr zZ0). Exactement de même, si grad f? (z9) — 0 pour un certain 
— $ € I (2), les conditions du théorème seront vérifiées en posant 
= — —1 et en considérant les autres valeurs de 4;, À;, @, comme 
étant nulles. Nous pouvons donc supposer que grad F'° (z,) 0, 
orad f? (z9) = 0 pour tous les à, j. Dans ce cas, l’hyperplan W: 
déterminé par l'équation (z — z,) . F° (z9) = 0 est la coupole 
de l’ensemble Q; au point z, (i — , k) et le demi-espace 
déterminé par l’ inégalité (z — 20) ue (2) < O0 une coupole de 
l’ensemble Q° au point 4 (EI (Zo)). 
Si l’on aphlique le théorème 36.1 à la restriction de la fonction 
F9 (z) à l’ensemble Z, on obtiendra l’existence d’un nombre 4, < 0 
et des vecteurs «ai (i — 1, ..., k), a; (j € T'(zo)), an(h = 1, ..., l) 
tels que 


ÿograd F° (25) = 2 ai + » aÿ+ > Ah; 
| - 5 
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où, dans le cas #, = 0, au moins un des vecteurs a;, ai, @a, est non 
nul. Il reste à noter que nous avons d’après la définition des ensem- 
bles Mi et M; 


ai= — 1; grad F° (20), a; = — };grad f? (20), 


où W; (à — 1, ..., k) sont des nombres réels et À; (j € I (z)) des 
nombres non positifs. 

Dans le théorème démontré, k, q, l peuvent être des nombres 
entiers non négatifs quelconques. En particulier, chacun d’entre 
eux (ou tout couple de ces nombres) peut être nul, de sorte qu’on 
obtient six cas particuliers du théorème 36.2. Par exemple, le théo- 
rème 36.1 est le cas particulier du théorème 36.2 que l’on obtient 
pour #4 — 0, q = 0. De tous les autres cas particuliers nous n’énon- 
cerons qu’un seul, obtenu pour { — 0. Dans ce cas, les ensembles 
Q,, ..., Q, n'existent plus, et pour l'intersection Q, ff .../f} Q,; 
on peut donc prendre tout l’espace £" (on peut également supposer 
que LÀ = 4 et Q, — E" de sorte que M, = E" et D (M,) = {2}. 

Théorème 36.3 Soit Z un ensemble déterminé dans l’es- 
pace E" par les relations (36.1), (36.2) et F9 (z) une fonction régulière, 
définie sur un ensemble ouvert de l’espace ET qui contient l’ensemble Y. 
Posons le problème suivant : trouver un point dans lequel la restriction 
de la fonction F9 à l’ensemble ZX atteint sa valeur minimale. Pour 
qu'un point z9 € à soit la solution du problème posé, i.e. on ait la 
relation 


F (29) < F (z) pour z € 2, 


il est nécessaire qu "il existe des nombres Vos Vis + - +, Va et des ue 
non positifs À;, j € T' (20) tels qu'au moins un des nombres 1;, À;, où 
i = 0,1,..., k, j EI (20) soit non nul et tels que l’on ait les con- 
ditions suivantes : 


(a) Vo0; 
k 
(B)_ D pagrad Ft (z)= D Ajgrad ff (20) — 0 
a—0 3€I(z0) 


Remarquons que si pour j € I (z,) on pose À; — 0, alors la con- 
dition (B) se met sous la forme 
k 


q « 
2 Va grad F° (20) 2 À; grad f? (29) = 0 


= 


et les égalités suivantes seront vérifiées : 


Mf° (Go) = af? (Zo) =... — hf? (zo) = 0 


(puisque f? (20) = 0 pour j € I (z,) et À; — 0 pour j é I (z5)). Ainsi, 
du théorème 36.3 découle directement le théorème 11.7 énoncé au 
chapitre I (p. 89): il suffit de remplacer À, par —0o:;. 
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Remarque 36.4. Considérons le cas particulier du théorè- 
me 36.3 que l’on obtient si l’on se passe des inégalités (36.2), i.e. si 
l’ensemble Z est déterminé dans £"* par les équations (36.1). Dans 
ce cas, la condition (6) du théorème 36.3 sera de la forme 


k 
D a grad F* (20) 0, (36.3) 

Œ—= 

ou, en coordonnées, 
k 

OFT (29) | | 
a —— = 0, = 1, ….., Île 30.4 
2 pu l n ( ) 


Ainsi, pour que la fonction F° (z) considérée sur l’ensemble déterminé 
par les équations (36.1) atteigne au point zQ un extrémum, il est néces- 
saire qu’il existe un vecteur non nul 1% = {VŸo, V1, : . ., Vr} qui satis- 
fait à la condition (36.3) (ou (36.4)). C’est le théorème de Lagrange 
classique sur l’extrémum lié. Le théorème 35.8 (et à plus forte 
mesure, 35.2) est une généralisation de ce théorème. 

Remarque 86.5. Dans les théorèmes 36.2 et 36.3 on n’exi- 
geait pas que les fonctions FÆ°, F1, . F* soient indépendantes, 
i.e. le rang de la matrice fonctionnelle 1e (2) soit égal à k + 1. 
Mais, dans le cas où les fonctions Æ°, F1, ..., F* sont dépendantes, 
l’assertion du théorème perd toute signification. 

Considérons le théorème plus général 86.2. Si au point z, € À 
le rang de la matrice fonctionnelle (5) est inférieur à À + 1, i.e. 
les vecteurs 


grad F9 (20), grad F1 (20), ..., grad F* (20) 


sont linéairement dépendants, alors les conditions (œ), (6), (y) sont 
satisfaites au point z, (indépendamment de la forme de l’ensemble Z 
et des propriétés de la fonction Æ° sur cet ensemble). En effet, il 
existe dans le cas considéré des nombres 4,, 1, . - ., YA, non tous 
nuls et tels que 


k 
2 va grad F° (20) = 0. 


En changeant, le cas échéant, tous les signes des nombres 1,,11, . .. 
., Ÿx nous pouvons supposer que %Ÿ, < 0 et donc pour À; = 0, 
ay = 0, toutes les conditions (a), (B), (y) seront satisfaites. 
Ainsi, formellement, le théorème 36.2 est toujours satisfait mais 
il n’est intéressant que dans le cas où les vecteurs grad ?! (Zo); 
0: 1..: k sont linéairement indépendants. Il en est de même 
des théorèmes suivants. 
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Remarque 36.6. Le théorème 36.1 n'exige pas que 
le système de cônes M,, ..., M, ne possède pas la propriété de 
séparation. Néanmoins, dans le cas où ce système de cônes jouit 
de la propriété de séparation, l’assertion du théorème 36.1 perd 
toute sa signification. 

En effet, supposons que le système de cônes M,, ..., M, pos- 
sède dans Æ£" la propriété de séparation. Alors, d’après le théorè- 
me 32.2, il existe des vecteurs &@;,, . .., &r, dont au moins un est 
non nul, tels que la direction du vecteur a; appartient au cône 
D (M), j=1,...,1,et l’on a la relation a; + ... + a; = 0. 
Par conséquent, pour 1, = 0, toutes les conditions (x), (B), (v) 
du théorème 36.1 seront satisfaites. 

Ainsi, formellement, le théorème 86.1 est toujours vrai, mais 
en réalité il n’est intéressant que dans le cas où le système de cônes 
M,, ..., M,ne connaît pas la propriété de séparation. 

Une remarque analogue s'applique tout aussi bien aux théorèmes 
suivants (puisqu'ils se déduisent du théorème 86.1). Voyons, par 
exemple, le théorème 36.2 et désignons par Il; (j € Z (z)) le demi- 


espace défini par l'inégalité (z — 20) ni (z9) LO, et par 
RACE Eee l'hyperplan tangent à l'hypersurface Fi (z) = 0 
construit au point Z0. Le théorème 36.2 n’est intéressant que dans 
le cas où le système de cônes l';, IL,, M, (i = 1, ..., k; j ET (2): 
k — 1, ..., 1) de sommet commun z, ne possède pas dans Æ£” la 
propriété de séparation (autrement l’assertion du théorème perd 
toute signification). 

Notons en particulier que l’assertion du théorème 36.2 (de même 
que du théorème 36.3) perd toute sa signification si le système de 
restrictions 36.2 n’est pas non dégénéré au point z,. En effet, la 
condition de non-dégénérescence de ce système de restrictions au 
point z6 signilie que tous les demi-espaces [l;, j € T (z9) ont un point 
intérieur commun. Si cette condition n'est pas satisfaite, 
alors, en vertu du théorème 32.5, le système de cônes Il; (j € 7 (20) 
possède la propriété de séparation et, donc, il en est de même a for- 
tiori du système de cônes [';, Il;, M». 

Ainsi, quoique formellement les théorèmes 36.2, 36.3 ne l’exi- 
gent pas, ils ne sont intéressants que dans le cas où le système de 
restrictions 36.2 est non dégénéré au point 2. 

Théorème 36.7. Soient Q,,..., Q,, E,,..., En des 
ensembles de l’espace E". Soit F9 (z) une fonction régulière, définie 
sur un ensemble ouvert de l’espace E" contenant l'ensemble E — 
=Q,N...NQNEN ...N Em. Posons le problème suivant. 
Trouver un point dans lequel la restriction de la fonction F° à l’ensemble 
2 atteint sa valeur minimale. Soient z9 € À et M; la coupole de l’en- 
semble Q; au point 20, (i = 1, . .., 1) et N'; la coupole de l’ensemble 
c; au point Zo (2 = 1, ..., m). Supposons enfin que le système de 
cônes N,, ..., Nyn (à sommet commun z,) ne possède pas la propriété 
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de séparation. Pour qu’un point z, donne la solution du problème donné, 
i.e. pour qu'on ait la relation 


F9 (29) £ F9 (z) pour zE X, 


il est nécessaire qu'il existe un nombre 1, et des vecteurs &1, . .., @ 
tels que la direction du vecteur a; est contenue dans le cône dual D (M; ), 


241. . et l’on a les conditions suivantes: 

(@) bo a 0; 

(B) (pograd F0 (2) — a — ... — ay) 8: LO pour tout vec- 
teur Ôz dont la direction appartient au cône N,fN ...N N»; 

(y) si VW, = 0, alors au moins un des vecteurs da, @>, . . ., @1 est 
non nul. 

Démonstration. En vertu du théorème 36.1 il existe 
un tel nombre 1, < 0 et de tels vecteurs &,, . .., @y, b,, . .., bn 


que la direction du vecteur a; appartient au cône D (M;), i — 1, : 
, d, la direction du vecteur b; appartient au cône D (NW), j — 
— 1,..., m, et l’on a la relation 


WgradF(z)=d@4+...+<a +b +... + b», (36.5) 


où dans le cas 1, — 0 au moins un des vecteurs &;, . .., @:1, D: Le 

ne Dm est non nul. Si nous ppo ons que Yo = Ù, a = ... 
... —= & = 0, nous obtiendrons b, + ... + b, — 0 et un des 
vecteurs D,, ..., 0, Sera nécessairement non ul. Mais ceci con- 
tredit le fait que le système de cônes N,, ..., N,, ne possède pas 
la propriété de séparation. Par conséquent, parmi les valeurs 1,, 
y, + -., il y en a non nulles, i.e. la condition (y) est satisfaite. 
Comme nous l’avons vu, 5, < 0, i.e. la condition (œ) est également 
satisfaite. 

Il reste à démontrer la condition (B). Posons 


n = V9 grad À (25) — 4 — ... — ax. (36.6) 


Comme n — db, + ... + b,, (voir (36.5)), la direction du vecteur 
n appartient, en vertu du lemme 32.1, au cône qui forme l’enveloppe 
convexe des cônes D (N,), ..., D(N,). D'après le corollaire 
31.4, cela signifie que la direction du vecteur n appartient au cône 
D(MN...NNh), ie. n ô z LO pour tout vecteur 82 dont la 
direction appartient au cône W, N ... NA Nn. Mais cela signifie, 
vu (36.6), que la condition (B) est vérifiée. 

Théorème 36.8. Soit Q' l’ensemble déterminé dans l'espace 
E" par les équations 


F1(23 =0,..., F#(z) = 0, 
et E' l’ensemble déterminé dans E" par les équations 


G'(z) = 0,..., G (2) = 0. 
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Supposons, d'autre part, que Q" est l’ensemble déterminé par les iné- 
galités 


f (2) 0, ..., f1 (2) KO 
=" l’ensemble déterminé par les inégalités 
g" (2) K 0, ..., g° (2) 0, (56.7) 


et Q,, ..., Q7, &,, ..., Eh des ensembles de l’espace ET. Soit, 
enjin, F9 (z) une fonction régulière, définie sur un ensemble ouvert de 
l’espace E” qui contient l’ensemble 


>=Q'ng"nan...NARE NE NEN... NEme 


Posons le problème suivant: trouver un point dans lequel la fonction 
F9, restreinte à l’ensemble Y, atteint sa valeur minimale. 

Soit z, € ZX et soit M; la coupole de l’ensemble Q; au point z o = 
1. , 1), N'j la coupole de l’ensemble &; au point z, (j = 1, 

" m). Désignons par I (20) l’ensemble de tous les nombres i — 1, 
++. q pour es Fo tda par J (Z) l’ensemble de tous les 
nombres j — 1, ..., p pour lesquels g? (z9) — 0. Supposons que tous 
les vecteurs 


grad G (2), i=1,...,r:; grad g° (x), j E J (2), 


sont non nuls. Désignons par L; l’hyperplan tangent à l’hypersurface 
G'(z) = 0 au point  (— 1. ..., r) et par P; le demi-espace, 
déterminé par l'inégalité (z — zo) grad gi (Zo) < 0, et supposons que 
le système de cônes convexes L:;, P;, "Na (où i — 4, aies Mol Cd. (2); 
h — 1, ..., m) ne possède pas la propriété de séparation. 

Pour qu’un point z, donne la solution du problème posé, i.e. pour 
que l’on ait la relation 


F9 (25) < F° (2) pour z2E X, 


il est nécessaire qu'il existe de tels nombres os, V1, - - -, Ver, de tels 
vecteurs @, - - -, @1 (dont les directions appartiennent respectivement 
aux cônes duaux D (M), . .., D (Mi)), et de tels nombres non posi- 


lifs À;, j E I (&), que l’on a les conditions suivantes: 
(&) Vo; 


k 
() > de grad F°(20) +. >» À; grad f” (20)—@1—...—a@) 8 O0 
a=0 JET (20) 


pour tout vecteur Ô< dont la ee appartient à l'intersection des 
cônes Li, P;, NatGi=1,...,r; jEJ (2); hk = 1, m) ; 

(y) si tous les nombres 1, _ ….., Vr et À; j E I (2) sont nuls, 
alors au moins un des vecteurs a;, . .., a; ne l’est pas. 

Ce théorème se déduit directement du théorème précédent (voir 
la démonstration du théorème 36.2). 
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Le théorème 36.8 s'avère le plus général parmi les théorèmes de 
Ce Sous-paragraphe. Dans son énoncé k, r, q, p, !, m peuvent être 
des entiers non négatifs. En supposant que certains d’entre eux sont 
nuls, nous obtiendrons une série de cas particuliers de ce théorème. 
Par exemple, le théorème 36.2 est un cas particulier du’ théorème 
36.8, obtenu en posant r — p — m — O0 (ou bien on peut poser 
r=p—=0,m=1 et, — N, — ET"). Parmi tous les autres cas 
particuliers, nous n’énoncerons ici que deux théorèmes (le premier 
d’entre eux s'obtient pour r — q — p — ! — 0 et le deuxième pour 
r—q—=1l=m = 0 en prenant en considération que la condition 
de non-dégénérescence du système de restrictions (36.7) au point 
Z est équivalente à la propriété de non-séparation des cônes P;, 
j € J ()). 

Théorème 36.9. Soit Q" l'ensemble déterminé dans l’espace 
E" par les équations 


F1(23 =0,..., F*(2) = 0, 


et Z,, ..., En des ensembles de l'espace E". Supposons en plus que 
F9 (2) est une fonction régulière, définie dans un ensemble ouvert de 
l’espace E" contenant l’ensemble 5 = QNE, NN... NE». Posons 
le problème suivant. Trouver un point dans lequel la fonction F° 
restreinte à l’ensemble X atteint sa valeur minimale. Soit z, € À et 
N'; la coupole de l’ensemble Æ; au point z, (j — 1, ..., m). Suppo- 
sons que le système de cônes N;,, ..., N, ne possède pas la propriété 
de séparation. 

Pour qu'un point z, donne la solution du problème posé, i.e. pour 
que l’on ait la relation 


F9 (25) < F9 (z) pour z EX 


il est nécessaire qu'il existe un vecteur 4 — {Wo; Vis - + «, Ÿr} 70n 
nul qui satisfait aux deux conditions suivantes : 


(&) Po KO; 
k 
(B) (2 1. grad F% (z,)) 82 LL O pour tout vecteur ÔZ dont la di- 


rection "appartient au cône N;,N. (AN 
Corollaire 36.10. Soit Q’ l'ensemble déterminé dans l'es- 
pace E" des variables 2}, . .., z" par des équations 


F'{2 =0,..., F*(z) = 0, 
et =” l’ensemble, déterminé par les inégalités 
BP à 285 8 0) O0: (56.5) 


Soit z EQ° NE" et supposons qu'au point z, le système de restric- 
tions (36.8) est non dégénéré, i.e. il existe dans E" un vecteur a dont 
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de produit scalaire avec chacun des vecteurs 
grad g° (25); à € J (Z0) (36.9) 


est négatif. Soit enfin F9 (z) une fonction régulière, définie dans un 
ensemble ouvert de l’espace E" qui contient l’ensemble Q°" MN €". Pour 
que la restriction de la fonction F° (2) à l’ensemble Q° N] &" atteigne 
son minimum au point 20, il est nécessaire qu'il existe un vecteur % — 


= {o, Vs - +, Vn} non nul qui satisfait aux deux conditions: 
(a) %o KV; 


(6) (> Ya grad F€ (2,)) 8: < 0 pour chaque vecteur 8£ dont le 
a—Ù 


produit scalaire avec chacun des vecteurs (36.9) est non positif. 
Signalons encore un autre cas particulier du théorème 36.8 que 
l’on obtient pour r — p — 0, m — 1. Ce cas est'intéressant par le 
fait que la condition de non-séparation des cônes ZL;, P;, N, y est 
absente. 
Théorème 36.11. Soit Q° l'ensemble déterminé dans l'espace 
ET par les équations 


F'(2 =0,..., F*(2 = 0, 
Q" l’ensemble déterminé par les inégalités 
F@<O0,..., fl(2 0 


el Q;, ..., Qy, E des ensembles de l’espace E”. Soit en plus F (2) 
une fonction régulière, définie sur un ensemble ouvert de l’espace E” 
qui contient l’ensemble 2 = QNQNQN...NQ:NE. Posons 
le problème suivant: trouver un point dans lequel la fonction F 
restreinte à l'ensemble Z atteint sa valeur minimale. Soit z, € È et 
soit M; une coupole de l’ensemble Q; au point 29 (i — 1, ..., l), 
et enfin N une coupole de l'ensemble E au point 2. 

Pour que le point z, donne la solution du problème posé, i.e. pour 
que l’on ait la relation 


F9 (29) L F9 (z) pour z EE 
il est nécessaire qu'il existe des nombres y, V1, - - ., ‘Va, des vecteurs 
1, -. ., @1 dont les directions appartiennent respectivement aux cônes 
duaux D (M,), ..., D (Mi) et des nombres non positifs À;, j € T (2) 
tels que l’on a les conditions suivantes 


(a) Vo 0 ; 
(P) ( 2 Ya grad F° (Zo) + 
= 
+ D Agradf (2)—@—...—a) 82 <0 
JE I(20) 
pour tout vecteur Ôz dont la direction appartient au cône N ; 


(y) si tous les nombres 5, V1, . - ., VW et À;j, j E T (z) sont nuls. 
alors au moins un des vecteurs ai, . .., @, ne l’est pas. 
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Pour la démonstration, il suffit de remarquer que le raisonnement. 
qui a servi à démontrer le théorème 36.7 reste valable pour m = 1 
(et le cône V, peut dans ce cas être choisi sans aucune din) 
D'ailleurs, le théorème 36.11 peut être obtenu à partir du théorème 
36.8 sans faire appel à la démonstration. Il suffit de poser r — p = 0; 
m=2, BH =E, M=N, Hs = No = alors MNN=N 
et, puisque le système de cônes N,, N, ne D pas la propriété 
de séparation, le théorème 36.8 est directement applicable. 

Remarque 36.12. Si certain des ensembles Q,, ..., Q;, 
y, +. ., cm dans le théorème 36.8 (ou dans les autres théorèmes 
de cette section) est fermé et convexe, on peut prendre le cône 
d'appui de cet ensemble convexe au point 2, pour cône corres- 
pondant M, ns », Mi, N;,..., Nn. En effet, d’après le théorème 
34.2, ce cône d’ appui est une cou pole de l'ensemble convexe 
considéré au point z,. Cette remarque permet de formuler une série 
de théorèmes qui se rapportent au cas où les ensembles Q,, ..., Q;, 
Hi, -.., Em (ou certains d’entre eux) sont convexes. 

Citons comme exemple le théorème suivant, que l’on obtient du 
théorème 36.11 en se basant sur la remarque 36.12 (et en nous limi- 
tant au cas — Oetqg— 0). : 

Théorème 36.13. Soient Q' l’ensemble déterminé dans l’espace 
ET des variables z!, . .., z" par les égalités 


F1(2) —0,..., F*(2) = 0 


et E un ensemble convexe fermé de l’espace E". Soit, en plus, F9 (z) 
une fonction régulière, définie dans un ensemble ouvert de ET qui 


Lun, 


contient l'ensemble Q' n° E. Pour, que la restriction de la fonction 
F° (2) à. l’ensemble Q° N & atteigne son minimum au point z EQ° NN 
N &, il est nécessaire qu'il existe un vecteur 1 — {Ÿo, V1, + - +, Pr} 
non nul qui satisfait aux deux conditions suivantes: 


(x) Yo < 0; 
k 


(B) ( D Ya grad F@ (20)) Ôz O0 pour tout vecteur 8? dont la 
a=0 


car 


direction appartient au cône d'appui de l’ensemble E au point 2. 
Exemple 36.14 (lemme de Gibbs). Soient p, (£), p2 (6), 
., Pn () des fonctions continûment différentiables. Si la fonction 
F° (2) = qu (2) + Pa (27) +... + pr (27), 
restreinte à l'ensemble © déterminé par les relations 
Dh he se areas 2 = 0; 2% 0: 232270: 
atteint son maximum au point Zo (25, Zÿ, . . ., 2), alors il existe un 
nombre À tel que 
pi(zi)=ÀA pour À>0, 
pi(z) LA pour zi=0. 
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Pour la démonstration appliquons le théorème 36.3 *). L'’en- 
semble ZX est déterminé dans l’espace E" des variables 2, ... 
., Z* par l’équation 


M(j=zt+... +7 —a—0 (36.10) 
el les inégalités | 
f(=—2<O0, i=1,...,n. (36.11) 


Si toutes les restrictions (36.11) sont actives (i.e. 25 — ... — 
= 2 — 0), le lemme de Gibbs n'affirme rien. On peut donc supposer 
qu’au moins un des indices n’est pas actif. D’après le théorème 36.3, 
il existe un tel vecteur 4 — {Wÿ,, w} qui satisfait à la condition 
w, > 0 (puisque la fonction F° atteint au point z  ummaximum 


et non un minimum) et à la condition (6). Comme 


grad F°(z2)={pi(z), p:(2), -.., qn(2)}, 
grad F1(z)— #1, 1,...,1}, 
grad f*(z) —4{0, 0, ...,0, —1, 0, ...,0} 


(où — 1 est situé à la i-ème place), la condition (6) se met sous la 
forme 


Vo{pi(zo)s Ps (26); + .., Pn (20)} + ai (1, 1, ..., 1}= {M,22,..., A7} 
où À 0 et À — 0 pour à # Z (29) (i.e. pour zi > 0). Autrement dit, 
Vopi (2) = —Wi+A,, i=1,...,n. 

En particulier, pour les indices non actifs (il y en a au moins un), 
nous avons pi (2) — —1W1, d'où il découle que 4, 0, i.e. 

Yo >> 0. Aïnsi, 
; 1\ — __ bi ÀÏ PE 
Pi (20) Vo Ù Vo ? i=1,...,n, 
ie. qi (2) = —#ÿ/ÿ, = À pour les indices non actifs et qi (zi) < À 
(puisque À' < 0) pour les indices actifs. 
Exemple 36.15. **) Appliquons le lemme de Gibbs pour 
{trouver le maximum de la fonction 
ñn 
l 
Fo()= D'a(t—e #) 
i=1 
sur l’ensemble Z déterminé par les relations (36.10), (36.11). Les 
nombres a;, b; sont supposés positifs. 


*) Le lemme de Gibbs a une démonstration directe plus simple qui ne fait 
pas appel aux conditions nécessaires d’extrémum. Il sert ici d'illustration. 

**) Voir J. M. Danskin, The theory of Max-Min and its application to weapons 
allocation problems, Springer-Verlag, New York, 1967, p. 11. 
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Soit Z — (2, ..., 3%) le point dans lequel la restriction de la 
fonction #°(z) à l’ensemble Z atteint son maximum. D'après le 
lemme de Gibbs, il existe un tel nombre À que 


. 7. : 
ab;e_ ‘io — À pour zi > 0 et a;b;e” "fo LÀ pour zi — 0. 

, ns ; | 

_ Pour z > 0 nous avonse Vo << 1 et donc a;b; > À. Par conséquent, 

Zi = O pour a;b; <}À. Inversement, pour a;b; > À nous avons 

zi >> 0. Ainsi, 

b; 

0 pour a;b; LÀ. 


Il reste à déterminer À . Remarquons pour cela qu’en vertu de 
(36.10), (36.12), on a la relation 


Î a;b; 
— In “+ pour a;b;> À; 
1 | MOUS (86.12) 


qui est une équation par rapport à À. Le premier membre de cette 
équation, comme il est aisé de voir, est une fonction continue de À 
définie pour 0 < À << oc qui décroît monotonément de œ à 0. 
Par conséquent, pour tout a > 0, cette équation a une solution 
unique. 

Exemple 36.16. Si la fonction régulière F° (2) restreinte à 
l’ensemble Z, déterminé par les relations (36.10), (36.11), atteint son 
maximum au point Zo — (25, 2, . . ., 2), alors il existe un nombre 
À tel que 


2 grad F0(2) À >, 82 (36.13) 
4= 1 


pour tout vecteur 8? — {6z!, . .., Ôz"} qui satisfait aux conditions: 
67 >0 pour zi—0 (ie. pour iCI(z)). (36.14) 


Pour démontrer, remarquons que d’après le corollaire 36.10 il 
existe un vecteur non nul 1 — {4,, Ÿ.} qui satisfait à la condition 


(y, grad F9 (z,) + 4, grad F1 (2,)) 84 < 0 (36.15) 
pour tout vecteur 84 — {ôz!, . .., 02°} qui satisfait aux conditions 


(36.14), et l’on a #, > 0. Cette relation se récrit sous la forme 


Vo (82 grad F° (25)) L — Ÿ1 2 ôz. 


Si 4, 0 (i.e. ÿ, > 0), en posant À — —W#,/y, on obtient la rela- 
tion (36.13). Il reste à considérer le cas 4, — 0. Dans ce cas , = 0, 
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la relation (36.15) prend la forme 
1 (OZ! + ... + 67) LO0 


pour tout vecteur 8z qui satisfait aux conditions (36.14). S'il existe 
au moins un indice non actif à (i.e. 2 =£ 0), en posant ôz' — +1, 
02? -- (0 pour j = i, on peut obtenir un vecteur ê4 qui satisfait à la 
condition (36.14). Par conséquent, +, < 0, d’où l’on déduit la 
relation Ÿ, — 0 qui est en contradiction avec ce que l’on vient de 
dire. Ainsi, tous les indices sont actifs, i.e. z, — (0, 0, ..., O). 
Mais, dans ce cas, la relation (36.13) est évidente: pour À il suffit 
de prendre le plus grand des nombres 
9F0 (29) OF (29) 
DRE TS PA 02" 


Avant d’énoncer la proposition suivante, rappelons la notion 
de fonction convexe. Soit F (z) une fonction définie dans un ensemble 
convexe P de l’espace E” (le cas échéant, dans tout cet espace). 
La fonction F est dite convexe si pour tout couple de points z,, z 
de l’ensemble P et tout point z du segment [z,, z], i.e. pour tout 
point z = (1 — À) z, + Az, où 0 À< 1, on à la relation 


F(2<(1—D)F (x) +XF (2). (36.16) 


La fonction F (2) est dite concave si la fonction — F (z) est convexe, 
i.e. Si la fonction F (2) satisfait à la condition suivante (pour z — 


F(D>(—NF (a) +AF (2). (36.17) 


Il est clair qu'une fonction affine (restreinte à un ensemble con- 
vexe) est à la fois convexe et concave. On démontre sans difficulté 
qu'inversement, si la fonction F (donnée sur un ensemble convexe 
P) est à la fois convexe et concave, alors elle est affine (plus exacte- 
ment, F coïncide avec la restriction d’une certaine fonction affine 
à l’ensemble P). 

On connaît du cours d’analyse la condition de convexité sui- 
vante: soit F (z) une fonction deux fois continûment différentiable, 
donnée sur un ensemble convexe ouvert P de l’espace £". Pour que 
la fonction F (2) soit convexe, il faut et il suffit que pour chaque point 
z, € P la forme quadratique 


D EF (0) gigi 
pi Ozi 02 S€ CU) 
1, = 1 
ne prenne (quels que soient £!, . .., E") que des valeurs non négatives. 


Si, en particulier, dans un certain point z, € P, la forme quadratique 
(56.18) est positivement déterminée (i.e. pour chaque vecteur & — 
— {£1,..., 89 non nul elle prend une valeur positive), 
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alors dans un certain voisinage suffisamment petit du point z, la 
fonction F (z) sera convexe. Une fonction qui possède cette propriété 
(i.e. est convexe dans un certain voisinage du point z,), s'appelle 
localement convexe au point 2. 

Corollaire 36.17. Soit Q' l’ensemble déterminé dans l’espace 
E" des variables 2}, . .., 2" par les équations 


F'(2 =0,..., F* (2) = 0. (36.19) 
et =" l’ensemble déterminé par les inégalités 
gr) SO; ..:, 80) KO: (36.20) 


Soit, en plus, F°(z) une fonction régulière, déterminée dans un 
certain ensemble ouvert de l’espace E" qui contient l'ensemble Q° NE” 
Soit, enfin, z9 EQ° NE”, et supposons qu'au point z, les fonctions 
£ (2), iE JT (2), sont localement concaves. Pour que la fonction F° (2), 
restreinte à l'ensemble Q" N Æ”, atteigne son minimum au point 20, 
il est nécessaire qu’il existe un vecteur non nul 4% {o, V1, - - ., VW} 
qui satisfait aux deux conditions suivantes: 


(x) Vo < 0; 
(P) ( à W grad F® (2,)) 84 < 0 pour tout vecteur 8x dont le produit 


scalaire 7. chacun des vecteurs grad g° (26), i € J (2,), est non positif. 

Cette assertion diffère du corollaire 36.10 par le fait que le sys- 
tème de restrictions (36.20) n'est pas supposé non dégénéré au point 
z,. On suppose, par contre, que les fonctions g° (2), i € J (z,) soient 
localement convexes au point z,. La validité du corollaire 36.17 
découle des considérations suivantes. 

Soit i E J (20), i.e. g° (29) = 0. Désignons par P; le demi-espace 
formé de tous les points z pour lesquels (z — z,) grad g° (2) < 0. 
Soit Z, un point suffisamment proche de z, (plus exactement, situé 
dans le domaine où la fouction g° (z) est localement concave). Si 
g* (1) >> 0, alors pour chaque point 3 = (1 — À) z, + Az, apparte- 
nant à l’intervalle (z,, z,) (i.e. pour 0 À 1), on a, d’après (36.17), 

g" (2) > (1 — 2) gf (20) + Ag (a), ie. gf (2) > Ag (a). 


Par conséquent, 


g (2) — gi (20) gŸ (2) gi (z1) g° (z1) 
LE = pont = 0: 
|z—2| h|zi—2| 7 À |z1—2 | | 24 — 20 Noire 


On peut en déduire que la dérivée de la fonction g° (z) au point 
dans la direction du vecteur 2z, — z, est p ositive, ji.e. 
(21 — 2) grad g° (2,9) > 0, et, donc, le point zA n'appartient 
pas au demi-espace P;. Ainsi, si g° (z1) > 0 (où le point z, est suf- 
fisamment proche de zo). alors z, & P;, i.e. tous les points du demi- 
espace P; suffisamment proches de 2, satisfont à la restriction g° (2) < 0. 
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L'intersection N — N P; de tous les demi-espaces P; qui cor- 


16J(20 
respondent aux cos (36.20) actives au point z, est un cône 
convexe de sommel Z,, et d’après ce qu’on vient de démontrer, tous 
les points du cône suffisamment proches de son sommet satisfont 
à toutes les restrictions (36.20), i.e. tous les points du cône W proches 
de son sommet sont contenus dans l’ensemble £”. Ainsi, À est la 
coupole de l’ensemble E” au point z, (pour l’application 14 
qui satisfait aux conditions 1), 2) de la définition 34.1 on peut pren- 
dre l’application identique du cône V). Alors, par construc- 
tion, le cône V consiste en tous les points z € E”" qui satisfont aux 


conditions 
(2 — 2) grad g° (25) K 0, i E J (20). 


Le corollaire 36.17 peut être directement déduit du théorème 36.11 
(pour q = L = 0). 

Remarque 36.18. En analysant la démonstration, on 
comprend aisément que la condition de concavité des fonctions 
g* (z), iE J (), peut être moins forte. En effet, il suffit d’exiger 
que le raisonnement effectué ne soit valable que pour les points z, 
appartenant au cône AV (et suffisamment proches de son sommet 2;), 
i.e. il suffit d'exiger que chacune des fonctions g' (2), i € J (z,) soit 
concave non pas sur tout le voisinage du point z,, mais seulement sur 
le cône N (dans un voisinage de son sommet). Autrement dit, la 


condition de concavité locale des fonctions g° (2), i E J' (zs), peut 
être remplacée par la condition suivante plus faible: chacune des 


fonctions g' (2), iE J (z) est concave pour un certain & > 0 sur 
l'ensemble N NA Z.où N — MN P; est le cône construit lors de la 


1EJ(z0) 
démonstration du corollaire 36.17 et >, est une boule de rayon & et 
de centre z,. Gette remarque permet de généraliser dans une certaine 
mesure le domaine d'application du corollaire 36.17. 
Exemple 36.19. Soit Q’ l’ensemble déterminé dans l’espace 
E* des variables zl, z?, zÿ par l’équation z° = 0 et &” l’ensemble 
déterminé par les inégalités 


(295 — 72 <L<0, 2 <O. (36.21) 


Autrement dit, Q” et = "sont déterminés par des relations du type 
indiqué dans le corollaire 36.10 pour nr = 5, k = 1, p — 2 et 
F'(a, 2, #) = 28, gf(2, 2, à) = (2) — 2°, (2, À, à) = #, 
Considérons maintenant la fonction ÆF° = —z2t — 7? — 7 et 
posons le problème de la recherche du minimum de la fonction F0 
sur l’ensemble Q’ N =”.Ilest facile de voir que l’ensemble Q”° A £” 
est entièrement contenu dans le quadrant 2: < 0, z? < 0 du plan 
33 -— () (fig. 149) et, par conséquent, le minimum de la fonction F° 


sur cet ensemble est atteint au point z, == (0, 0, 0). 
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D'autre part, toutes les deux restrictions (36.21) sont actives 
au point Z%. Nous avons 


grad F0 (2) ={—1, —1, —1}; 
grad F1 (z5)= 0, 0, 1}; 


grad g1 (20) =£{0, —1, 0}; | 
grad 8? (25) = {0, 1, 0}. 


La condition ($) indiquée dans l’énoncé des corollaires 36.10 et 36.17 
prend la forme 


(Po (—1; —1, —1} + Ÿr {0, 0, 1} Ôz < 0 


pour tout vecteur ôz — {ôz', ôz?, 6z?} dont le produit scalaire avec 

chacun des vecteurs (36.22) est non positif, i.e. pour tout vecteur 

& — {6z!, 0, 67%}. On en déduit 

2 que Yo — 0,1%, — 0. Ainsi, il 

| n'existe pas de vecteur non 

nul 4 — {w,, %} satisfaisant 

à la condition ($), i.e. quoique un 

/ minimum soit atteint au point 

/_ Z9 — (0,0,0), les conditions 

/ nécessaires indiquées dans les 

d corollaires 36.10, 36.17 ne sont 

2" pas satisfaites. Ceci s'explique 

TITTN = >, par le fait que les corollaires 

DAT 2 7 indiqués sont ici inappli- 

Le y cables. Le corollaire 36.10 

7 est inapplicable, puisque le 

| système de restrictions (36.24) 

n'est pas non dégénéré au point 

Z, (il n'existe pas de vecteur a 

dont le produit scalaire avec 

chacun des vecteurs grad gl (z,), 

grad £g? (z,) Soit négatif). Le corol- 

Fig. 149 laire 36.17 est inapplicable, car 

la fonction g! (z!, z?, n’est pas 

localement concave au point 2,. 

Cet exemple nous montre que la condition de non-dégénérescence 

du système de restrictions (36.8) au point z, est essentielle dans le 

corollaire 36.10 (et, par conséquent, l’hypothèse que le système de 

cônes V;, ..., N, ne possède pas la propriété de séparation est 
essentielle dans le théorème 36.7). 


(36.22) 


Z 


Remarque 36.20. Nous avons donc démontré plusieurs théorèmes 
donnant des conditions nécessaires d’extrémums de fonctions. Le fondement 
de la démonstration était toujours le théorème 35.1 et le théorème 36.1 qui en 
découle. Des théorèmes de ce genre peuvent être obtenus par d’autres méthodes. 
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Voyons brièvement la méthode qui appartient à Jordan et Polak *). Consi- 
dérons son application à la démonstration du théorème 36.9, dans le cas m = 1 
(i. e. nous allons considérer un seul ensemble £ = € qui possède au point 
la coupole NW = N;). 

Supposons que z est un point qui donne la solution du problème du mini- 
mum de la fonction F° sur l’ensemble Q' NN &. Considérons l’espace E*# de 
dimension k + 1 aux variables 2°, xl, ..., xk et désignons par g l’application 
de l’espace E" dans ER*1 déterminé par les formules zî — Fi (z), i = 0, ..., k. 
Posons | 

, 4? 
DU, Geph ste Je ir 
02] 


A l’aide des nombres a}, on peut définir une application affine f: En —>+ Eh+1 
suivant les formules 
n 


gi VS 'ai(zi—z)+ Fix), i=0, 1, ..., k. 
J= 1 
Comme les fonctions F9, F1, ..., FR sont régulières, on a 
- OF (20) 
; ' | t{z : ’ 0 
Fi (2) = Fi PT DAS LE G 1=0, 41 46 
2= 


ou, sous forme vectorielle, 
g(=f (+0, (2: 


Cette relation montre que j est l'application affine tangente au point z0 à l’ap- 
plication g de l’espace E" dans ER*1, 

L'image du cône convexe N par l’application affine f est un cône convexe 
f (N) dans l’espace E**#1 de sommet au point f (z0) = g (20). Désignons par A la 
demi-droite issue du point f (20) = g (z) de l’espace ER*1 et dirigée dans le 
sens du demi-axe négatif 2°; autrement dit, la demi-droite A est formée des 
points a, xl, ..., x qui satisfont aux relations 


2 F0 (20), 2 = FT (20), 2° = F (20) . . ., 2h = FR (20). 


Admettons que A est une demi-droite intérieure du cône convexe f (W) 
dans l’espace ER*1. Alors, d’après le théorème 34.7 (applicable à l’ensemble & 
et à l'application g), il existe un cône ME f (N) de sommet g (z) tel que A 
est une demi-droite intérieure du cône M, celui-ci étant une coupole de l’en- 
semble g() au point g (z). Ainsi, les cônes M et A sont inséparables dans Ek+*1 et 
par conséquent, vu le théorème 35.1, on peut trouver un point € g(E) N| A 
différent de g (2), i. e. il existe un point z € E tel que le point x = g (z) diffère 
de g (z) et appartient à la demi-droite A. Autrement dit, 


F9 (2) < F9 (2), FT (2) = F? (20), RS | FR (2) = FR (29), 


ie zEQ' et F9(z) << F9 (z). D'autre part, comme nous avons vu, z€ &. 
Ainsi, z€EQ' NE et F° (2) < F9 (z,). Mais ceci contredit le fait que la fonc- 
tion Æ°, restreinte à l’ensemble Q’ N &, atteint son minimum au point 2. 
La contradiction obtenue démontre que A n’est pas une demi-droite intérieure 
du cône convexe f (WN) et, par conséquent, en vertu du théorème 30.4, il existe 
un hyperplan [qui sépare la demi-droite A du cône f (W). 


*) Voir le premier article cité dans le renvoi de. la page 80 et aussi l’article 
suivant: M. Cannon, C. Cullum, E. Polak, Constrained minimization problems 
in finite.dimensional Spaces, J. SIAM Control 4, n° 3 (1966). 
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Désignons par 4 = {Wo, W%1, . . ., #4} le vecteur normal de l'hyperplan FT 
dirigé de telle manière que le cône f (W) soit situé dans le demi-espace fermé né- 
gatif (et, par conséquent, la demi-droite A dans le demi-espace positif) ; montrons 
que le vecteur 1 est le vecteur cherché. Puisque le vecteur £, = {—1, 0, ..., 0} 
possède la même direction que la demi-droite A et, par conséquent, est dirigé 
vers le demi-espace positif, on a Lo > 0, i. e. —1-4, + O1, +... + 0, > 
> 0. Ainsi, la condition (œ) du théorème 36.9 est satisfaite. 

Supposons, d’autre part, que ôz est un vecteur dont la direction appartient 
au cône N. Autrement dit, ôz = z — z, où z est un certain point du cône NW. 
Alors, la direction du vecteur f (ôz = f (z) — f (z9) = f (z) — g (z9) appartient 
au cône f (NW), et, donc, ce vecteur est dirigé vers le demi-espace négatif. Par 
conséquent, 1pf (2) < 0. En se rappelant la définition de l'application f et en 
écrivant le produit scalaire en coordonnées, on obtient l'inégalité indiquée 
dans la condition (6) du théorème 36.9. 

Ce raisonnement élégant peut être appliqué, sous une forme un peu plus 
compliquée, à la démonstration du théorème 36.11. Mais le théorème le plus 
général (36.8) ne peut être obtenu par cette méthode (pour cela il aurait fallu 
démontrer que, si les ensembles &,, . .., Æ, possèdent dans leur point commun 
z, des coupoles W;, ..., N,, le système de cônes W;, ..., N, ne possédant 
pas la propriété de séparation, alors WN, f ... f\ NM, est la coupole de l’ensemble 
EN... AN Em au point z; malheureusement, ceci est tout simplement 
faux dans le cas général). 

Remarque 36.21. La méthode largement répandue de Doubovitski- 
Milioutine consiste (si on l'utilise dans les problèmes des extrémums des fonc- 
tions) à appliquer le théorème 32.8 au lieu du théorème plus général 32.5, et au 
lieu du théorème plus délicat 35.1, on utilise un résultat du même genre qui 
se rapporte seulement au cas où les fonctions 1; sont régulières (voir remar- 
que 35.2), tandis que tous les cônes M;, M2, . . ., MA, sauf un, sont solides. 
Ainsi, la méthode pour obtenir des conditions nécessaires d’extrémum exposée 
ici est une généralisation de la méthode Doubovitski-Milioutine. 
Pour cette raison, les résultats indiqués dans ce sous-paragraphe sont plus géné- 
raux que ceux que l’on peut obtenir à l’aide de la méthode de Doubovitski- 
Milioutine. 

Examinons en guise d’exemple la démonstration du corollaire 36.10 par la 
méthode de Doubovitski-Milioutine. Désignons par ZL le plan tangent de la 
variété Q’ de dimension n — k, déterminée dans £* par les équations F1 (z) — 
= 0,..., FR(z) = 0. (Rappelons que, d'après la remarque 36.5, on peut sup- 
poser les fonctions F” (z), ..., FR (z) indépendantes au point z, i. e. telles 
qu’elles déterminent une variété de dimension nr — k dans un voisinage du 
point z.) Supposons, d’autre part, pour fixer les notations, que ce sont les pre- 
mières s restrictions (36.8), qui sont actives au point z, et désignons par M;, 
i= 4,...,s, le demi-espace de l’espace EE composé de tous les points pour 
lesquels 

(z — 29) grad gû (20) € 0, 
et par M, le demi-espace formé de tous les points z pour lesquels 

(z — 29) grad Fi (20) & 0. 
[Il est évident que M,, Mu, . .., M, sont des cônes solides fermés de l’espace 
E" à sommet commun z, et que le plan L passe également par le point z. Ceci 


permet d'appliquer le théorème 32.7. 
Supposons que l'intersection 


LnhinM)nnM)n...n(intM) (36.23) 


est non vide, i. e. il existe une demi-droite Z issue du point z, située dans le 
plan Z et étant une demi-droite intérieure de chacun des cônes Y,, 
M1, ..., M. Il existe alors une courbe lisse A, issue du point z,, possédant la 
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demi-droite tangente Z au point z, et située dans la variété Q’. Puisque Z est une 
demi-droite intérieure du demi-espace M,, l’angle entre la demi-droite Z et 
le vecteur grad F° (z,) est! obtus. Par conséquent, pour tous les points de la 
courbe A suffisamment proches de z, et différents de ce point, on a la relation 
F9 (z) < F9 (z,). D'une manière analogue, pour tous les points de la courbe 
À suffisamment proches de z, et différents de z,, on a la relation gt (z) < g° (20) = 
= 0,i—1,...,s. Ainsi, on peut choisir un point z sur la courbe A tel que 
ce point satisfait à toutes les relations F1(z) = 0, ..., FR (z) = 0 et à toutes 
les restrictions (36.8) (i. e. un point appartenant à l’ensemble Q’ N\ E”) et tel 
que F0 (z) << F9 (29). Mais alors, la restriction de la fonction F9 à Q’N &” 
ne peut atteindre son minimum au point 2. 

Ainsi, pour que la fonction 7° restreinte à l’ensemble Q° f\ & ” atteigne son 
minimum au point z, il est nécessaire que l'intersection (36.23) soit vide. Mais 
si cette intersection est vide, alors d’après le théorème 32.8, il existe de telles 
fonctions aîffines f*, f°, fl, ..., f$ qui s’annulent au point z, et ne sont pas 
toutes identiquement nulles, que la fonction f* est identiquement égale à 0 dans 
le plan Z, la fonction f*t étant non positive sur le demi-espace M;, i — 0, 1, ... 
..., #, et l’on a la relation 


P+PR+f+...+p= 0. 


Comme f° (z,) = 0 et la fonction f° est non positive dans le demi-espace Mo, 
on a grad f° = —1p, grad F° (20), où 1, < 0. D’une manière analogue, grad f? — 
— À;grad g7(z0), où À, > 0 (Gj—=1,...,s, ie. j € J (z)). D'autre part, 
lorsque la fonction affine f* est identiquement nulle sur Z, on a 


grad f* = —1}, grad F1 (20) — . . . — 1 grad FR (20). 


Montrons que le vecteur % — Go VW, - . . V2} est le vecteur cherché. 

La condition («) du corollaire 36.10 est, comme nous voyons, satisfaite. 
Vérifions la validité de la condition (B). Soit ôz un vecteur qui possède un 
produit scalaire non positif avec chacun des vecteurs (36.9), i. e. avec chacun 
des vecteurs grad g2 (20), j = 1, ..., s. Alors 


f0 (z0 + Oz) — Ÿ0 (z0 + Oz) — fo (z0) — 82 grad f0— — 1582 grad F0 (z0) ; 
k 
f# (z0+ Ô2) = f* (20+ 82) — F* (20) = 82 grad f*= — Ÿ, 1,82 grad Fi (z0) ; 
41 
13 (z0+ 82) = ff (20 + 82) — fŸ (z0) = 8? grad fi=A;8+ grad gi (20) K 0 
pour j=—1, ...,s. 


En additionnant membre à membre ces relations et en prenant en considération 
l'identité f* + fP + fi+...+ 7 = 0, nous obtenons 


0 f* (20 82) + 10 (20 + 82) + f! (20 + Ê2) +. . + fS (20 + 02) < 
k 
<— D, Va (87 grad FŸ (z0)). 
o—0 


Aïnsi, la relation (6) du corollaire 36.8 est également satisfaite. 

Il reste à démontrer que le vecteur 4 — {ÿo, 1, . . ., Ÿ} est non nul. 
Supposons, au contraire, que Vo = V1 = . .. = y = 0. Alors f = 0, ff = 0 
et les fonctions j!, ..., f$ sont liées par la relation f1 + ... + fs = 0. Sup- 
posons que «a est un vecteur qui a un produit scalaire négatif avec chacun des 
vecteurs (36.9). Alors 


F5 (co + &) = ff (20 + @) — fi (20) = @ grad fi = À; (a grad gi (z0)) K 0 
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quel que soit j € J (2), i.e. pour tout j = 1, ..., s. On en déduit, en vertu de 
la relation fl+...+fS=0 que ff(2 +a)=0, j—=1,..., s, i.e. 
À; (a grad g1 (z9)) = 0, et, par conséquent, À; — 0 quels que soient j = 1, ... 
..., s D'où il découle que fl = 0, ..., f$ = 0. Ainsi, toutes les fonc- 
tions f*, f°, fl, ..., fs sont identiquement nulles, ce qui contredit la cons- 
truction. La contradiction obtenue nous montre que le vecteur 4 — 
= {bo, UV, - .., Vs} est non nul. 

Citons un exemple d’application du:théorème "36.8 qui ne s’accomode pas au 
cadre de la méthode de Doubovitski-Milioutine. 

Exemple 36.22. Désignons par &, l'ensemble décrit dans l’espace ET 
par les relations | 2? | < (z1)°, z1 5 O0, par E, l’ensemble décrit par les relations 
[4 < (#)°, 8 > 0 et par Q’ l’hypersurface déterminée par l'équation 


F1 (9 = 8 — (4) = 


Il est aisé de voir que le demi-plan NW, déterminé par les relations z? = 0, 4 > 0 
est une coupole maximale de l’ensemble &, dans tous les points du plan Z, (de 
dimension n — 2) déterminé par les relations zl = z? — 0; exactement de la 
même manière, le demi-plan W, déterminé par les relations z4 = 0, z# > 0 est 
une coupole maximale de l’ensemble &, dans tous les points du plan Z, (de dimen- 
sion nr — 2) déterminé par les équations  — z4 — 0. Enfin, la coupole maxi- 
male de l’hypersurface Q’ (en chacun de ces points) est l’hyperplan l' tangent à 
cette hypersurface. 
Ainsi, dans les points de chacun des ensembles 


LENS, NN! 


deux des trois coupoles W,, N,, LT ne sont pas solides, tandis que dans les 
points de l’ensemble Z; N L, N Q° toutes les trois coupoles ne sont pas solides, 

e sorte que dans les points de ces ensembles la méthode de Doubovitski-Miliou- 
tine est inapplicable (quelle que soit la fonction F° dont nous cherchons le mini- 
mum sur l’ensemble Q’ N &, N &). (Il est bien entendu que l’on peut étudier 
séparément la fonction F° dans les points de chacun des ensembles 


LNnENQ, HNLNQ, LiNnLNQ", 


et aussi dans les points qui n’appartiennent à aucun de ces ensembles, mais 
ceci rappelle déjà la méthode, étudiée dans le n° 7, de la considération séparée 
des fonctions sur diverses faces du « polyèdre déformé ».) 

Considérons l'application du théorème 36.8 dans ces conditions, et cher- 
chons, par exemple, le minimum de la fonction 


n n 

19 L 

0 — LA VIE EME 2 

F (2) de > (z ) En 36 Z 

1=1 i=1 

sur l’ensemble Q’ A &, N &.. Supposons que cette fonction atteint son minimum 
au point 20 — (4, ..., 2) € Q' A 1 N €. Désignons maintenant par N,, N: 
des coupoles maximales des ensembles E,, &, au point z, (pour z, € L;, ces cou- 
poles"maximales sont décrites dans le théorème 34.4). Remarquons que les cônes 


N, et NW, sont, comme on le voit, non séparables, et ceci permet d'appliquer le 
théorème 36.8. La condition (B) du théorème 36.8 prend la forme 


(p «grad F0 (z0)) 2 + 1p41 (026 — 226625) < 0 (36.24) 


pour tout vecteur 52 — {ôz!, ..., ôz"} dont la direction appartient au cône 
N1 N NW: On vérifie directement, que pour 


Gin, 627%, br, = 214 (36.25) 


(et quels que soient 625, ..., ôz") la direction du vecteur 62 appar- 
tient au cône NW, f\ V2. Par conséquent, pour ÿ9 = 0, 4, 0 on aurait obtenu, 
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en vertu de 36.24, l'inégalité 1, (2626 — 225025) < 0 pourtous Ôz6, 026, ce qui 
est impossible. On a donc 4%, < 0. D'après la condition (x), nous obtenons 
%) < 0, de sorte que l’on peut supposer %% = —1. La condition (36.24) prend 
alors la forme 


> (a+) Ôzt +14 (026 — 275025) < 0. (36.26) 
= 


Comme cette relation est satisfaite, en particulier, lorsque ôz!, ôz2, Ôz3, Ôz4 
prennent les valeurs (36.25) et Ô25 = ...— ôz" = 0, on a 


19 49 19 49 
1 Ds 1 2 LÉ 2 3 ue 3 4 AR 4 
(+2) 2-42 (28425) 284 (ocre) 2842 (208422) 28 < 0. 
En écrivant cette relation sous la forme 
18 ((&0) + 20) + 78 ((&0) + 20) + 73 (20) ENT: (23)2 + 4 (22)2 + 4 (26) +36 Go + 20) < 0 


et remarquant que tous les termes du premier membre, sauf le dernier, sont 
certainement non négatifs (les deux premiers termes sont non négatifs d’après 
la définition des ensembles &, et &,), nous trouvons z4 + z5 < 0. De ce fait, 
en nous servant à nouveau de la définition des ensembles &,, &,, nous obtenons 
zà = 0, z$ = 0, et donc z$ = 0, z$ — 0. Maintenant, les relations (36.25) pren- 
nent la forme ôz1 — 6z? = Ôz — 07 — 0 et pour ces valeurs, la relation (36.26) 
se récrit de la manière suivante : 


n 
— > (2i+%) Ôzi + 1b4 (625— 225025) < 0, 
1—5 
donc, elle est satisfaite pour toutes les valeurs de 625, . .., ôz". Par consé- 
quent, 


pi (23+3%) — 21h46 = 0, 

— (2845) +0, 

: (2344) 0, (36.27) 
PTE 


Les deux premières relations ci-dessus, avec la relation z$ — (25)? — 0 (va- 
lable car z9 € Q'), forment un système de trois équations à trois inconnues zÿ, 
z$, W,. En éliminant zÿ et 1, de ce système, nous avons 


49 49 
2a$+ 520$ (2 (2425) =0 
ou 
{ 2 - , 19 
(ä+5) («C2 554) —=0, 


d’où l’on trouve z$ — —1/6, et, donc, z$— 1/36. Ensuite, les relations (36.27) 
suivantes nous donnent les valeurs z7 = ...— z% — 19/72. 
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Aïnsi, le minimum de la fonction F° (z) sur l’ensemble Q°’ N &, N E, ne 

peut être atteint qu’au point z, aux coordonnées 
1 nt 19 

gi = =7 0, = — 7: 20 = 3G BE — 55e 
En effet, dans ce point, la fonction F° (atteint son minimum, puisque 
l’ensemble Q' N &, N E, est fermé, la fonction F° est continue et croît infini- 
ment lorsque le point z tend vers l'infini (dans n’importe quelle direction). 

Remarque 36.23. Remarquons, pour conclure, que les conditions 
nécessaires ci-indiquées imposent plus de conditions que celles obtenues par la 
méthode du n° 7. 

En effet, soit, par exemple, z, un point du « polyèdre déformé » M, mettons, 
situé sur sa « face » de dimension n — 1, et supposons que les conditions néces- 
saires du n° 7 sont satisfaites en ce point, i.e. les dérivées de la fonction F° (2) 
au point z, dans les directions contenues dans cette face sont nulles. On peut 
saisir la signification de la situation indiquée du point de vue des méthodes du 
présent sous-paragraphe comme suit. Le « polyèdre déformé » est l’ensemble 
QG" de dimension nr décrit par le système de restrictions du type (36.2) et sa 
« face » de dimension n — 1 est l’ensemble de points dans lequel une des 
restrictions (mettons, la première) est active, et les autres ne le sont pas. Ainsi, 
la « face » dont il s’agit est décrite par les relations 


f(z) = 0, f2(z) <0,..., fa (z) < 0. (36.28) 


D'autre part, les relations (36.1) sont absentes (car 4 — 0), i. e. l’ensemble Q° 
coïncide avec l’espace E? tout entier et, donc, Q’ NA Q” = Q” est Le « polyèdre 
déformé » considéré. 

Admettons que la fonction F° (z), restreinte à Q ”, atteint son minimum dans 
un point de la « face » de dimension n — 1 (36.28), de sorte que seule la première 
restriction (36.2) est active en ce point. Alors, les conditions (a), (6) du théorè- 
me 36.3 prennent la forme 


Vo grad F0 (20) = —} grad fl (20), Vo < 0, M & 0 (36.29) 


(si nous avions %Ÿ, = 0, alors, d’après la relation grad f! (z,) =£ 0, nous aurions 
également À, = 0, ce qui est impossible). Si a est un vecteur tangent à la 
« face » (36.28) au point z,, i. e. le vecteur qui satisfait à la relation @ grad f! (25) — 
— 0, alors, d’après (36.29), nous avons 


a grad F0 (20) = 0. 


Autrement dit, la dérivée de la fonction F (z) au point z, dans toute direction 
tangente à la « face » (36.28) est nulle. Mais ce sont là justement les conditions 
nécessaires d’extrémum (indiquées dans le n° 7) donc, du théorème 36.3 on 
peut déduire les conditions nécessaires du n°7. 

Mais le théorème 36.3 (i.e. dans le cas considéré la relation (36.29)) per- 
met de déduire bien plus. En effet, nous nous sommes seulement servis de la 
colinéarité des vecteurs grad F° (z) et grad f! (z,). tandis que la rela- 
tion (36.29) affirme en plus que les directions de ces vecteurs doivent 
être opposées. Dans le cas donné (i. e. pour les points appartenant aux « faces » 
de dimension n — 1), c’est là l'information supplémentaire (par rapport aux 
méthodes du n° 7) contenue dans le théorème 36.3. L'interprétation géométrique 
de cette condition supplémentaire est évidente : si les vecteurs grad Æ° (z) et 
grad f! (z,) sont de directions opposées, alors la fonction F° (z) seracrois- 
sante vers l’intérieur du domaine Q” (i.e. dans la direction de décrois- 
sance de la fonction f!(z)), ce qui signifie justement que la fonction F°z at- 
teint son minimum au point 2. 

D'une manière analogue, on peut retrouver l'information supplémentaire 
contenue dans le théorème 36.3 dans le cas où le minimum est atteint sur les 
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« faces » de dimension plus petite. Ainsi, le théorème 36.3 (qui n’est qu’un cas 
particulier des résultats plus généraux) précise et rend plus puissantes les métho- 
des discutées dans le n°7. 


37. Condition suffisante d’extrémum d’une fonction. À présent, 
déduirons, pour certaines restrictions sur les ensembles et les fonc- 
tions considérés, des conditions nécessaires et suffisantes d’extré- 
mum. La nécessité de ces conditions découle des résultats du n° 36, 
et la suffisance sera établie ici. 

Notre exposition se fondera sur le théorème suivant, concernant 
le minimum d’une fonction affine *) sur l'intersection de cônes 
convexes. De même que dans la section précédente, pour le cas du 
problème de maximum d’une fonction, le sens de l'inégalité 
dans la condition (œ) ci-dessous doit être changé. 

Théorème 37.1. Soit f° une fonction affine de E" et soient 
VW, ..., Mi, Ni, ..., N,, un système de cônes convexes de sommet 
commun z, dans E" ne possédant pas la propriété de séparation. Pour 
que la fonction f°, restreinte au cône 


K=MNn...NMNnmMn us (Ne 


atteigne son minimum au point Zo, il faut et il suffit qu'il existe un tel 
nombre 1), et de tels vecteurs a;, . . ., @1, dont les directions appartien- 
nent respectivement aux cônes duaux D (M), . .., D (Mi), que l'on 
ait les conditions suivantes : 

(œ) Yo < 0; 

(B) (po grad f° — ay — ... — a) êz LO pour tout vecteur 6z 
dont la direction appartient au cône NN ... NN». 

Démonstration. Supposons que la fonction f°, restreinte 
au cône Æ, atteint son minimum au point 4. Comme chaque cône 
M; est une coupole de l’ensemble Q; — M; au point z0 (i — 1, ... 

., L) et chaque cône W; est la coupole de l’ensemble E; — W; 


au point Z, ( — 1, ..., m), on peut déduire du théorème 36.7 (appli- 
qué à la fonction F° — f°) l’existence d’un nombre 1, et des vecteurs 
Œj, - . ., y qui satisfont aux conditions (æ), (B), (y) du théorème 


36.7. La condition (6) du théorème 36.7 coïncide avec la condition 
(B) du théorème 37.1. Démontrons que 1, < 0. 

Supposons, au contraire, que %Ÿ, — 0. Alors, la condition (6) 
(qui a déjà été vérifiée) se met sous la forme (—a;, —...—a]) ôr< 


*) Le mot « linéaire » n’a pas de signification unique en mathématique. 
Aïnsi, en analyse fonctionnelle on considère des opérateurs linéaires et des fonc- 
tionnelles Jinéaires qui sont toujours supposés homogènes. Au contraire, dans 
la terminologie traditionnelle de l’algèbre et de la géométrie (équations linéaires, 
transformations linéaires), ce terme ne suppose pas l'homogénéité. Pour éviter 
les malentendus, nous disons dans ce livre « homomorphismes d'espaces vectoriels » 
(au lieu d’« opérateurs linéaires », page 117) et « applications affines » (page 154). 
Le mot « linéaire » est conservé parfois dans son sens algébrique traditionnel, 
i.e. on appelle équation linéaire une équation de la forme F (x) = 0 où F (x} 
est une fonction affine (page 162). 
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O0 pour tout vecteur ôz dont la direction appartient 
au cône V, AN ... NA VN,. Cela signifie que la direction du vecteur 
A —...— a, appartient au cône D (N, AN ... NV,) et donc, 
en vertu du corollaire 31.4 et du lemme 32.1, on peut trouver des 
vecteurs b., ..., bA tels que la direction du vecteur b; appartient 
au cône D (N;) Gj = 1, ..., met l’on a 


SH ie =D... LD. 


Mais, d’après le théorème 32.2, ceci contredit le fait que le système 
des cônes convexes À, . .., M1, N:, ..., N, ne possède pas la 
propriété de séparation (remarquons qu'en vertu de la condition 
{y) du théorème 36.7 et de l’hypothèse 1, — 0, il y a des vecteurs 
non nuls parmi les vecteurs @1, ..., a). Ainsi, l'hypothèse 4, — 0 
entraîne une contradiction; par conséquent, vu la condition (a) 
du théorème 36.7, on a #, < 0. Donc, la nécessité des conditions 
énoncées est établie. 

Démontrons la suffisance. Supposons qu'il existe un 
nombre 1, et des vecteurs a;,..., &@, satisfaisant aux conditions («), 
(B) du théorème 37.1. Prenons un point quelconque z du cône X. 
Comme la direction du vecteur 82 — z — z, appartient au cône 
NN... Nm: on a, en vertu de la condition (f), 


(ÿ, grad f° — a; — ue — &;) (z — 7) L O0 


En plus, puisque la direction du vecteur a; appartient au cône 
D (Mi), tandis que la direction du vecteur z — z, appartient au 


cône Æ, et, donc, a fortiori au cône M; (i — 1, ..., l), on a 
@; (z — 2) < 0 et, par conséquent 
(po grand 7°) (3 — 20) L' (ai +... + &i) ( — 20) KO 


Cela signifie, en vertu du théorème 21.8, que %, (f° (z) — f° (z0)) < 0. 
En nous rappelant que 4%, << 0, obtenons f° (z) — f° (z,) > 0, ï.e 
Ï° (20) £ f° (2). Ainsi, la fonction f° restreinte au cône Æ atteint son 
minimum au point Z. 

Remarque 37.2. Pour démontrer la suffisance, nous n'avons 
pas fait appel à l’hypothèse qui affirme que le système de cônes 
convexes M1, ..., M1, N1, ..., Nh ne possède pas la propriété 
de séparation. Par conséquent, s’il existe un nombre \,, et des vecteurs 
1, - .., @ qui satisfont aux conditions (a) et (6) du théorème 37.1, 
alors la restriction de la fonction u au cône K atteint son minimum au 
point z, (ceci étant vrai sans qu’on impose des conditions quelconques 
sur le système de cônes M1, . . ., Mu, N1, ..., Nm 

Remarque 37.3. La condition (æ) du théorème 37.1 peut 
être encore affaiblie. À savoir, on peut la remplacer par les condi- 
tions (œ) et (y) du théorème 36.7 (sans changer la condition (f) 
du théorème 37.1). En effet, si on a les conditions (æ) et (y) du théo- 
rème 36.7 et la condition (fB) du théorème 37.1, on peut en déduire, 
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comme nous avons vu en démontrant la nécessité, la condition 4, << 0 
(dans l'hypothèse que le système de cônes convexes M,, ..., Mi, 
N:,..., Nn ne possède pas la propriété de séparation). 

Remarque 37.4. Dans l’énoncé du théorème 37.1, les cônes 
N:, ..., N, ne sont jamais considérés séparément ; on fait toujours 
appel à leur intersection V, N ...N N,. On aurait donc pu se 
limiter à un seul cône N— NN... MN M», i.e. considérer 
seulement le cas m — 1. Cependant, nous avons donné ce théorème 
justement dans cette formulation, car cette forme sera plus commode 
par la suite. 

Passons maintenant à la considération du problème du mini- 
mum d'une fonction #° restreinte à l’ensemble ZX = Q, N . 

ND... NEm (Comme dans le théorème 36. 7). 
Imposons certaines restrictions sur les ensembles Q;, Æ; et la fonc- 
tion }°. Tout d’abord, notons la condition suivante, qui sera im- 
posée sur la fonction 7°: 

(a) La fonction F° (2) est régulière et définie sur un ensemble ouvert 
qui contient D, et il existe une fonction affine f° (z) qui satisfait à la 
condition 
f9 (z) L F9 (z) dans le domaine de définition de la fonction F (2) 
et JV 2) = EF (G): (37.1) 
(D'ailleurs, il aurait suffi de supposer, comme dans la section pré- 
cédente, non pas que }" est régulière, mais qu’elle possède des déri- 
vées continues seulement dans un voisinage du point z, considéré.) 

Remarquons que l’on peut déduire de la condition (a) l’égalité 


grad À (2,4) = grad f?. (37.2) 


En effet, lorsque FÆ° (z) => f° (2), on a pour tout point z différent 
de z, et appartenant au domaine de définition de la fonction Æ° (2) 
F0 (z) — F0 (20) > f0 (z) — F0 (20) __ F0 (2) — 10 (z0) 

|z—20 | Îz—20| Îz—zo| ? 

et, par conséquent, la dérivée de la fonction F° (z) au point z, dans 
une direction quelconque est supérieure ou égale à la déri- 
vée de la fonction f° (z) dans cette même direction. Autrement dit, 
a grad F° (z,) > a grad f°, ou 

a (grad F9 (z,) — grad f°) > 0 
pour tout vecteur a. Remplaçant ici & par —a@, nous obtenons 

a (grad FÆ° (z,) — grad f°) = 0 


pour tout vecteur &. En particulier, pour @a = grad Æ° (z,) — grad f", 
nous avons grad Æ° (z,) — grad f° = 0, ce qui démontre l'égalité 
(37.2). 

Notons que la condition (a) sera certainement satisfaite si la 
fonction F° (z) satisfait à l'hypothèse suivante: 
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(a”) la fonction F°(z) est définie sur un ensemble ouvert convexe 
qui contient à, de plus elle est régulière et convexe. 

En effet, supposons que la condition (a’) est remplie et définis- 
sons la fonction affine f° (z) par l'égalité 


f° (2) = F° (0) + (z — 20) grad F° (20). 


Il est évident que f° (z,) — F° (z,). D'autre part, soit z, un point 
différent de z, et appartenant au domaine de définition de la fonc- 
tion Æ° (z). Pour tout À qui satisfait à la condition 0 < 1 < 1, le 
point z — (1 — À) z, + Àz, est contenu dans l'intervalle (z,, z,} 
et, donc, la fonction FÆ° est définie au point z. Vu la convexité de 
cette section, nous avons (voir (36.16)) 


F9 (2) < (1 — À) F° (20) + AF° (a), 
1.e. 
POP Go po (21) — F9 (20), 
et, par conséquent, 
FO (z)— F0 (z9) __ F0 (2) — F0 (20) PL (z1) — #0 (z0) 
[3—20l A zi—20l Oo |21—2%l 


Le premier membre de cette relation a une limite pour À —0 (À > 0) 
égale à la dérivée de la fonction F° (z) au point z, suivant la direction 
du vecteur z, — z,. Autrement dit, cette limite est égale à 
a grad °° (z,), où «a est un vecteur unitaire de la même direction que 


le vecteur z, — z,. Ainsi, 

F0 (z1) — F0 (z0) 
|21—20 | 
D'autre part, si 2, — Z9 — | 2 — Zo | & (le vecteur z, — z, ayant 
la même direction que & et sa longueur étant |2z, — z,| fois plus 
grande), alors, en multipliant la relation (37.3) par le nombre posi- 

tif | Z1 — Z, | on obtient 
(21 — 20) grad F° (26) = | 21 — 20 | | @ grad F° (25) < 
< F9 (21) — F° (2), 


a grad F0 (2) < (37.3) 


ou 
FO (2) > F9 (co) + (1 — 20) grad F° (20) = f° (mi). 


Ainsi, pour z, € Z, on a la relation f° (z,)  F° (z,), i.e. la fonction 
F9 (z) vérifie la condition (a). 

Remarquons que les conditions (a) et (a”) ont été énoncées pour 
le problème du minimum de la fonction Æ° (z) sur un certain 
ensemble. Dans le cas du problème du maximum d’une fonc- 
tion, il faut inverser le sens de l’inégalité dans la condition (a) et, 
dans la condition (a”), supposer la fonction non plus convexe, mais 
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concave. Mais, de toute facon, le problème du maximum de la 
fonction F9 (z) peut toujours être remplacé par le problème du mi- 
nimum de la fonction — F (2). 

Indiquons maintenant les conditions qui seront imposées sur 
l’ensemble X. A savoir, nous supposerons que, pour chaque i — 
— 1, ,.., l,il existe un cône M; qui satisfait à la condition suivan- 


(b) Le cône M; est la coupole de l’ensemble Q; au point 2, et, en 
outre, Q,œ M;,i= 1, L. 

D'autre part, nous allons supposer que pour chaque j — 1, 

., m il existe un cône NW; qui vérifie la condition suivante : 

(c) le cône N'; est la coupole de l’ensemble =; au point z, et, en 
outre, BC N;, j =1,..., m. 

Enfin, imposons encore une condition que nous appellerons 
condition de position générale: 

(d) le système des cônes convexes M,, ..., M,, N,,..., Nn 
ne possède pas, dans E", la propriété de séparation. 

Elucidons tout d’abord la signification de la condition de posi- 
tion générale. Supposons qu’elle n’est pas remplie. Alors, en vertu 
du théorème 32.2 il existe des vecteurs a, . .., @y, 01, . . ., Om, 
dont au moins un est non nul, tels que la direction du vecteur a appar- 
tient au cône D (M;), i = 1, ..., 1, la direction du vecteur b; au 
cône D (N;), j = 1,..., m, et l’on a la relation 


D ee oi do EL. ED, = (37.4) 


Considérons les deux cas possibles, correspondant au fait que le 
vecteur &; + ... + &, s’annule ou non. 

Supposons @ + ... + @y — 0. Alors, d’après (37.4), on a 
également la relation 6, + ... + by — 0. Considérons le cas où 
il existe un vecteur non nul parmi les vecteurs @,, . .., @; (si a, — 
= ,.. = di =0, alors les raisonnements ci-dessous doivent être 
appliqués non pas à M,, ..., M, mais à N,, ..., N,). Alors, 
d'après le théorème 32.2, le système de cônes convexes M,, ..., M, 
possède la propriété de séparation, i.e. il existe un hyperplan FT 
qui sépare l’un d'eux de l’intersection des autres. Donc, M,f 

. NA M, € T et, par conséquent, a fortiori 


Messe M NE les TN er 
D'après la condition (b), (c), on déduit que l’ensemble 


= 0lr-s ll one lei es 


est entièrement contenu dans l’hyperplan l'. Mais alors, on peut 
restreindre la fonction F° (z) à l’hyperplan [’, i.e. considérer, au lieu 
de l’espace E”, l’espace euclidien lT& Æ£" de dimension ji n f é- 
rieure. 
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Ainsi, si en plus de la relation (37.4), nous avons a, + ... 
... + & = 0, on peut diminuer la dimension de l’espace 
E" contenant l’ensemble © sur lequel on cherche le minimum de la 
fonction F°. (Si, dans l’espace F', le système de cônes 1,, ..., M}, 
N,,..., Nm ne satisfait toujours pas à la condition de position 
générale, on peut alors appliquer de nouveau le même raisonnement.) 

Supposons maintenant &@;, + ... + a; 0. Posons 4, = (. 
Alors, le nombre 1, satisfait évidemment à la condition («) du 
théorème 36.7. IL est également évident que parmi les vecteurs 
A, .., @, Certains sont non nuls, i.e. la condition (y) du théorème 
36.7 est également satisfaite. Ainsi, en vertu de (37.4), nous avons 


D —d4=bd +... +0 


et, donc, d’après le corollaire 31.4 et le lemme 32.1, la direction 
du vecteur —a; — ... — «a; appartient au cône D (N,f 
«A M), ie 
(—a — ... — a) 88 <LO0 


pour tout vecteur êz dont la direction appartient au cône W, f\ . 

N Nm. Mais cela signifie (en vertu de l'égalité 1, = 0) que 
la condition (B) du théorème 36.7 est remplie. Ainsi, pour a, +. 
... + 4; Æ 0, les conditions nécessaires de dinu indiquées 
dans le théorème 36.7 sont certainement satisfaites in dépen- 
damment du choix de la fonction Æ (z) (car, d’après l'égalité 
Ÿ, — 0, le rôle de la fonction F° (z) dans ces conditions nécessaires 
s'avère éliminé). 

Autrement dit, si la condition de position générale n’est pas 
satisfaite, on peut, ou bien diminuer la dimension de l’espace £? 
qui contient l’ensemble Z, ou bien constater que les conditions 
nécessaires de minimum, déduites dans le paragraphe précédent, 
sont toujours valables, indépendamment du fait que la fonction 
F9 (z) atteint son minimum au point z, ou non, i.e. ces conditions 
nécessaires perdent leur signification ; il n’y a plus de sens à parler de 
leur suffisance. Tout ceci nous montre que la condition de position 
générale est tout à fait naturelle. 

Théorème 837.0. Supposons donnés dans l’espace E" les 
ensembles Q,,..., Q, HE, ..., Em, les cônes M,;, ..., M), 
N,,..., Nn de sommet commun z, qui appartient à l'ensemble 


2 = {&,/f sertie rh sf Em 


de manière à ce que les conditions (b), (c) et (d) soient satisfaites. Sup- 
posons donnée, par ailleurs, une fonction F° (z) qui satisfait à la condi- 
tion (a). Pour que la restriction de la fonction F° à l’ensemble ZX atteigne 
son minimum au point Zo, il faut et il suffit qu’il existe un tel nombre 
Yo et de tels vecteurs &;, . . ., &,; que la direction du vecteur a; appar- 
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tient au cône dual D (M;), i = 1, ..., L et l’on a les conditions 
suivantes : 

&) Po < 0; 

(B) (po, grad F9 (2) — ai — ...—a;) 6 LO pour tout vecteur Ôz 
dont la direction appartient au cône NN ...NN»h 

Démonstration. Supposons que la fonction F° (z) res- 
treinte à l’ensemble ZX, atteint son minimum au point z, € à. 
Alors, d’après le théorème 36.7, il existe un tel nombre 1, et de 
tels vecteurs &@,, . .., @, que la direction du vecteur a; appartient 
au cône D (M;), i — 1, ..., l, et l’on a les conditions (œ), (B), (y} 
du théorème 36.7. Puisque la condition (6) est la même dans les 
théorèmes 36.7 et 37.5, il n’y a qu’à vérifier que 14, << 0. Ceci se dé- 
montre de la même manière, mot à mot, que le même fait dans Le théo- 
rème 37.1. Ainsi, la nécessité des conditions énoncées est 
établie. 

Démontrons la suffisance. Supposons remplies les con- 
ditions (a)-(d) et les conditions (œ), (6) indiquées au théorème 37.5. 
Alors, la fonction affine f° (z) dont l’existence est supposée dans 
la condition (a) satisfait à la relation 


grad F9 (z,) = grad f°. 
Par conséquent, la condition (f) prend la forme 
lbogradff— a — ... — an) ôr<0 


pour tout vecteur 82 dont la direction appartient au cône NW, N] .. 
. A Mn. D'où l’on déduit, en vertu du théorème 37.1, que la 
restriction de la fonction 1° (2) au cône 


K=MNn...NMNnMNn..NNm 


atteint son minimum au point z,. Mais si, d’après les conditions 
(b) et (c),ona 2€ K, la restriction de la fonction f° (z) à l’ensemble 
2 atteint son minimum au point Z,5, i.e. 


f° (zo) < Ÿ° (z) pour z€ Z. 
On déduit alors directement de la condition (a) que 


F° (20) = f° (20) < f° (2) K F° (2) pour zE 2, 


i.e. la fonction F° (2) restreinte à l’ensemble ZX atteint son minimum 
au point Z. 

Remarque 37.6. Nous ne nous sommes pas servis de la 
condition (d) pour démontrer la suffisance (comparer à la remarque 
37.2). Donc, s’il existe un nombre 1}, et des vecteurs @:,..., @; (dont 
les directions appartiennent au cône D (M,), ..., D (M;)) tels qu’on 
a les conditions (a), (b), (c) et les conditions (a), (B) du théorème 37.5, 
alors la fonction F' (2), restreinte à l'ensemble Z, atteint son minimum 
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au point z, (et ceci est vérifié sans imposer de conditions sur le 
système de cônes M,, ..., M,, N,,..., N,). 

Pour obtenir plusieurs corollaires du théorème 37.5, signalons 
quelques situations spéciales dans lesquelles les conditions (b) et 
(c) sont certainement satisfaites. 

Soit F une fonction affine non constante définie dans l’es- 
pace E" et Q — Ker F son noyau. Il est clair que l’ensemble M — Q 
est une coupole de l’ensemble Q@ (en tout point z, € Q) et l’on a 
QC M. Ainsi, la condition (b) est toujours satisfaite si l’ensemble 
Q; et le cône A7; satisfont à la condition suivante: 

(b') l’ensemble Q; est le noyau d’une certaine fonction affine non 
constante (i.e. est un hyperplan) et M; = Q. 

Exactement de la même manière, la condition (c) est toujours 
valable si Ë; et N'; satisfont à l'hypothèse suivante: 

(c”) l’ensemble E; est le noyau d’une certaine fonction affine non 
constante (i.e. est un hyperplan), et N; = E;. 

Une autre situation dans laquelle les hypothèses (b) et (c) sont 
vérifiées est celle de l’ensemble convexe et de son cône d’appui. Soit 
S un ensemble convexe et M son cône d'appui au point z, € 2. 
Alors, d’après le théorème 34.2, M est la coupole de l’ensemble Q au 
point z, et l’on a évidemment 9€ M. Ainsi, la condition (b) est 
certainement satisfaite si l’on a l’hypothèse suivante: 

(b”) l’ensemble Q; est convexe et M; est le cône d'appui de l'en- 
semble Q; au point z0 € Q;. 

Il en est de même de la condition (c) qui est nécessairement rem- 
plie si l’on a l'hypothèse suivante: 

(c”) l’ensemble &; est convexe et N; est son cône d'appui au point 
Za € Si. 

° Un cas particulier de la situation considérée est celui des res- 
trictions convexes. Soit f (z) une fonction convexe régulière et Q l’en- 
semble de tous les points satisfaisant à la condition f (7) 0. Soit, 
d'autre part, z, un point pour lequel f (z,) = 0, et M le demi-espace 
déterminé par l'inégalité (z — z,) grad f (z,) < 0. De la définition 
d’une fonction convexe (voir (36.16)), on déduit directement que l’en- 
semble Q est convexe, et, puisque la fonction f est régulière, le demi- 
espace M est un cône d'appui de l’ensemble convexe Q@ au point z4. 

Ainsi, la condition (b”), et donc (b), est nécessairement satis- 
faite si l'hypothèse suivante est vériliée: | 

(b") l’ensemble Q; déterminé par la restriction f (z) < 0 où f 
est une fonction convexe régulière qui s’annule au point 2, et M; est le 
demi-espace (z — z,) grad f* (2) < 0. 

Exactement de la même manière, la condition (c) est valable si 
l'hypothèse suivante est vérifiée: | . 

(c") l'ensemble, &; est déterminé par la restriction g’ (z) < 0, où 
gi est une fonction convexe régulière qui s'annule au point 0, et N; 
est le demi-espace (z — z,) grad g° (z) < 0. 
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En supposant que dans le théorème 37.5 une partie des ensembles 
Q; et des cônes M; satisfait à la condition (b”), et une autre partie à 
la condition (b”) (et que la même chose se rapporte aux ensembles 
E; et aux cônes V;), nous obtenons du théorème 37.5 l’assertion 
suivante : 

Théorème 37.7. Soit Q° l'ensemble de l’espace E" déterminé 
par les équations 


F1 (2) = 0,..., F* (2) = 0, 
et &° l’ensemble de E" déterminé par les équations 
G(z) — 0, ... G (2) — 0, 


où F' (2), ..., F* (2), Gl(2), ..., G' (2) sont des fonctions affines 
non constantes. Supposons ensuite que Q" est l’ensemble déterminé par 
les inégalités 


jf (2) 0, ..., ft (2) KO, 
=" l’ensemble déterminé par les inégalités 
(2) 0, ss PRE O0, 


où fr (2), . .., ff (2), gl (2), . .., gP (2) sont des fonctions convexes 
régulières. Supposons enfin que Q:, ..., Q;, &, ..., Eh sont des 
ensembles de l’espace E", et F° (2) une fonction définie sur un certain 
ensemble ouvert de l’espace E" qui contient l’ensemble 


2=9N9n9n...NNENENEN... NE 


Supposons qu'au point z, € Z la fonction F° (z) satisfait à la con- 
dition (a) (ou à la condition (a')) et qu’un système de cônes M1, . .. 

, Mi, Ni, ..., Nm de sommet 2,, vérifiant les conditions (b), 
(c) est donné. (Par exemple ces conditions sont valables si les ensembles 
Q:, ..., Gr, H,, ..., Eh sont convexes et M, ..., Mi, Na, ... 

., Nm sont des cônes d'appui de ces ensembles au point 29.) Dési- 
gnons par I (2) l’ensemble de tous les nombres i — 1, , q pour 
lesquels f* (2) = 0, et par J, (2) l’ensemble de tous les nombres j = 
= 1, ..., p pour lesquels g° (z,) — 0. Nous SUpPOSErOns que tous Les 
vecteurs grad f° (2), i ET (Z), de même que grad g’ (z,), j E J (20), 
sont non nuls. 

Posons K; — Ker F°, i — 1, ., k; L; = Ker G, j = 1, 
-.., r, et désignons par Il; le demi- -espace déterminé par l inégalité 
(z — z,) grad f* (z,) O0, i € I (Go); et par P; le demi-espace déterminé 
par l'inégalité (z — 2) grad 8° (zo) 0, j € J (Z,9) et supposons que 
le système de cônes convexes 


Ke, se Lie ro Ur CCE): 
P;GEJ (o)),, M G=1,..., D, N;G—=1, ..., m) (87.5) 
ne possède pas dans E" la propriété de séparation. 
22—01208 
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Pour que la fonction F (2), restreinte à l'ensemble ZX, possède un 
minimum au point Zo, il faut et il suffit qu'il existe des nombres 1), 


Vi, - - ., Yr, des nombres non positifs À;, i € I (z) et des vecteurs 
1, - - -, @1 dont les directions appartiennent aux cônes D (M,), ... 
., D (Mi) tels que l’on a les conditions suivantes: 
(a) Yo << 0; 
k 
(8) (Diva grad F& (20) + 
a—0 
+ D À; grad f Ÿ(20) — A —... — a1)64 < 0 
JET (z0) 


pour tout vecteur Ôz dont la direction appartient à l'intersection des cônes 
Li, P;, NiG=1,...,r; jEJ (Go); k=1,..., m). 

Pour démontrer, il suffit d'appliquer le théorème 37.5 en remar- 
quant que l’ensemble W déterminé par les relations 


(D SO, il (2); g (9 LO, jé J (2) 


contient le point z, en qualité de point intérieur (dans l’es- 
pace Æ£”), et, donc, l’ensemble W a pour coupole au point z, l’espace 
E" tout entier. On peut donc ajouter l’ensemble W au système d’en- 
sembles 

K ; (i — À, ses k), L; Ü = 4, “ 3:80 r), f" (2) ZO(GET(Z)), 

PDO GES BG) Get, se DEL, 24m) 
(et le cône E” au système de cônes (37.5)), sans contredire les pro- 
priétés (b), (c), (d). 

Remarque 37.8. Comme dans les théorèmes précédents, 
l'hypothèse suivant laquelle le système de tous les cônes (37.5) ne 
possède pas la propriété de séparation n’a servi que pour la démons- 
tration de la nécessité. Quant à la suffisance des conditions énon- 
cées, elle reste vraie sans cette hypothèse. Remarquons que dans ce 
théorème il suffit de supposer régulières et convexes seulement celles 
des fonctions f*, g’ qui correspondent aux restrictions actives 
f" (4) 0, g? (2) L O0 au point Z. 

Le théorème 37.7 est le plus général des théorèmes de cette sec- 
tion. Dans son énoncé les nombres k, r, q, p, l, m peuvent être des 
entiers non négatifs quelconques. En supposant que certains d’en- 
tre eux sont nuls, nous obtenons du théorème 37.7 toute une série 
de cas particuliers. 

Par exemple, le théorème 37.5 est le cas particulier du théorème 
37.7 qui s'obtient en posant k — r — p — q — 0. De tous les 
autres cas particuliers, nous n’énoncerons que trois théorèmes (le pre- 
mier s'obtient pour k — r — p — q = l — 0, le deuxième pour 
r—=p—l—m—0 et le troisième pour r — q — l[ — m — 0). 
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Théorème 379. Soit = —#,fN .../fNMEm, où E, ... 
-.. Em sont des ensembles de l’espace E”, et soient N:, ..., N» 
de tels cônes convexes de sommet z, € Z que N,; est la coupole de l’en- 
semble &; au point %, et l’on a N;= E;, i — 1, ..., m. Supposons, 
en outre, que le système de cônes N;, ..., N, ne possède pas dans E” 
la propriété de séparation. Soit enfin F9 (z) une fonction qui satisfait 
à la condition (a) ou (a’). Pour que la fonction F° (z) restreinte à l’en-. 
semble Z atteigne son minimum au point z,, il faut et il suffit que le 
vecteur grad F° (z,) possède un produit scalaire non négatif avec tout 
vecteur dont la direction appartient au cône NN ... NA MN (te. 
qu'il existe de tels vecteurs &1, . - ., &n dont les directions appartiennent 
respectivement aux cônes duaux D (N:), ..., D'(N,) que l’on a 
grad F° (29) = —@; — ... — an). 

La dernière remarque (entre parenthèses) contenue dans l’énoncé 
de ce théorème se déduit du corollaire 31.4 et du lemme 32.1. Notons 
que la condition imposée dans ce théorème sur les ensembles £; et 
les cônes NW; est satisfaite, en particulier, si l’ensemble E; est con- 
vexe et V; est son cône d’ appui au point 4 € 2, j — 1, Lt 

Théorème 37.10. Soit Q° un plan de E" déterminé par 
le système d'équations linéaires 


F(—0,..., FF(2 —0 
(ie. les fonctions F?, . .., F* sont affines *)) et les vecteurs 
grad F1, ..., grad F* 


sont linéairement indépendants. et soit Q" l’ensemble déterminé par les 
: P 


inégalités 
Pa 0, ..., j2 (D <0. (37.6) 


Soient, par ailleurs, z, un point de l’ensemble Q° N Q" et F° (z) une 
jonction qui satisfait à la condition (a) (ou (a')). Supposons que toutes 
les jonctions f* (2), i ET (z) sont convexes et régulières. Supposons 
enfin qu'il existe un point z, € Q° pour lequel tous les produits scalaires 


(21 — 29) grad f* (20), à ET (20); (37.7) 
sont négatifs. 
Pour que la fonction F° (2), restreinte à l’ensemble Q° N Q", atteigne 


son minimum au point Z9, il faut et il suffit que le vecteur grad F° (z,) 
puisse se mettre sous la forme 


k 
grad F° (20) = à ÿ; grad F° (20) + : 2 grad ‘4 (2o); (37.8) 


où tous les nombres À;, j € I (z,) sont non ue 
Démonstration. Posons X; — Ker F, i—1,...,k, 
et désignons par Il; le demi-plan déterminé par l'inégalité 


*) Voir la note de la page 329. 
22% 
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(z — 2,) grad (2) KO, j ET Go) Montrons que le système de cônes 
convexes K;. Il; (i — — 1, ..., k; j ET (Z)) ne connaît pas la pro- 
priété de séparation. 

Admettons le on Alors, en vertu du théorème 32.2, il 
existe des vecteurs @;, b; (où i — 1, , k; JET (2)), non tous 
nuls, tels que la re . vecteurs a, b, appartienne respective- 
ment aux cônes D (K;), D (II;) et l’on a 


2 a; + Z bd; — 0. 


Prenant en considération la forme des cônes X;, Il;, nous obtenons 
alors l’existence de nombres @;, B; (i — 1, ..., k; j EI (z)), non 
tous nuls, tels que les nombres f; sont non négatifs et la relation 
suivante est satisfaite 


à œ; grad F+, À B; grad f? (z) = 0. (37.9) 
I(z0) 

Remarquons que tous les rte B; dans cette relation ne 
peuvent être nuls (i.e. il existe parmi les nombres B; au 
moins un du est positif), car autrement les vecteurs grad F, 
EE , k, seraient linéairement dépendants. Puisque z, € 40 
Z, € et on a (z, — 3) grad Ft —=0,i—1, k. Par conséquent, 
en prenant le produit scalaire de la relation (37.9) par le vecteur 
Z, — Zp, nous obtenons 

: B; (z1— 20) grad f” (20) = 0 

JEI(z0) 
Ceci est une contradiction, car tous les nombres (37.7) sont négatifs 
tandis qu’il existe parmi les nombres non négatifs $;, j € I (20), 
au moins un qui est non nul. La contradiction obtenue montre que 
le système de cônes K;, IT; (i — 1, ..., k; j € I (z0)) ne possède pas 
la propriété de séparation. 

Posons maintenant E, = N, = £" et appliquons le théorème 
37.7 pour r = q = l = 0, m = 1. Nous obtenons alors qu'il existe 
des nombres w,, À; (i — 0, 1, ..., k; j ET (z)) qui satisfont à la 
relation 


(à ÿ: grad F' Gone 2 hs grad (zn)) 840 
pour tout vecteur êz (ïi.e. tout vecteur ô£ dont la direction appar- 
tient au cône NV, = E”), et l’on a 5, << 0, tous les nombres À, 
j € T (zo) étant non positifs. Cela signifie que 


k 
2 pr grad F'()+ D À; grad f? (20) = 0 
i=0 ÿEI(z0) 


et l’on peut supposer 1, — —1, d’où découle la relation (37.8). 


$ 10] CRITÈRES D’EXTRÉMUM 341 


Théorème 37.11. Supposons donné dans E" un plan Q 
déterminé par un système d'équations linéaires F* (z) = 0, i = 1, 


k, les vecteurs grad F", i = 1, , k, étant linéairement indé- 
pendanis. et soit &" l’ensemble déterminé par les restrictions g° (z) < 0, 
j—=1,..., p. Soit, par ailleurs, z, un point de l'ensemble Q"N | E'et 


F9(z) une fonction qui satis fait à la condition (a) (ou (a'}). Supposons 
que toutes les fonctions g? (2), j E J (20), sont convexes et régulières. 
Enfin, supposons qu’il existe un point z, € Q” pour lequel tous les pro- 
duits scalaires 


(31 — 20) grad g (Zo), j € J (20); 


sont négatifs. 

Pour que la restriction de la fonction F9 (z) à l’ensemble Q" {NN X" at- 
teigne son minimum au point 20, il faut et il suffit qu’il existe un vec- 
teur 1 — {Vo, Vu, - . ., Pr}, tel que l’on a les conditions suivantes: 


(@) Yo 0; 
k 


D" 


(B) ( >, 4 grad F4 (20)) ô2 < 0 pour tout vecteur 82 dont le pro- 
a—0 


duit scalaire avec chacun des vecteurs grad g° (z,), j € J (20) est non 
positif. 

Ce théorème se démontre d’une façon analogue au précédent. 

Rémarque 37.12. Considérons le cas particulier du théorè- 
me 87.11 qui correspond à 4 — 0, ï.e. le cas où l’on cherche le mini- 
mum de la fonction F° (2) restreinte à l’ensemble =”, déterminée 
par le système d’inégalités g° (2) < 0, j — 1, , ..., p, ce système 
étant non dégénéré au point 29. 

Désignons par À le cône déterminé par le systeme d'’inégalités 


(z — 20) grad g’ (2) K 0, j ET (20). 


Soit / une certaine demi-droite issue du point z, et située à 1” in- 
térieur du cône X. Il existe alors un tel point z de la demi- 
droite {, que le segment [z,, zl est entièrement contenu dans l’en- 
semble Æ”. Autrement dit, chaque telle demi-droite pénètre à l’inté- 
rieur de l’ensemble E” (fig. 150). Par conséquent, la condition in- 
diquée au théorème 37.11 (à savoir Ô4 grad F° (z,) > 0 pour tout 
vecteur ê? dont la direction appartient au cône K) signifie que La 
dérivée de la Jonction F' (2) au point z, suivant une direction quelconque 
qui pénètre à l’intérieur de l’ensemble E" est non négative. Il est aisé 
de voir que cette dérivée est positive. Autrement dit, le long 
de toute demi-droite issue du point z, qui pénètre à l’intérieur de 
l’ensemble Æ”, la fonction Æ° (z)est croissante dans un voi- 
sinage du point z,. Cette observation s’accorde bien au fait que la 
restriction de la fonction F° (z) à l’ensemble €” atteint son m i n i- 
mum au point Z. | 
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Il faut néanmoins remarquer que le fait observé tout seul, sans 
les autres conditions du théorème 87.11 (en particulier, sans l’hypo- 
thèse de convexité des fonctions g” (z), j € J (z0)), ne garantit pas 
encore un minimum au point z,. L'exemple suivant illustre cette 
situation. 

Exemple 37.13. Considérons l’ensemble € 
le plan des variables z!, z? par les relations 


(21)2+ (22)2— 821 62L0, 4z1— (2)? (2)2— 92L0 (37.10) 


et étudions le problème de la recherche du minimum de la fonction 


F9 (z!, z?) = z? sur cet ensemble. Ainsi, l’ensemble &” est déterminé 


"” 


déterminé dans 


T{Zp) ={ d} 
grad 7 {29 





Fig. 150 Fig. 151 


par des inégalités de la forme g! (z!, 27) < 0, g? (z!, 72) < 0, où £, g? 
sont les fonctions contenues dans les premiers membres des relations 
(37.10). Le point z9 — (0, 0) appartient évidemment à l’ensemble 
ES”, et en ce point les deux restrictions (37.10) sont actives. 
Etudions les variations de la fonction F° sur l’ensemble £ ” dans 


un voisinage du point z,. Puisque 
grad g' (20) = {—8, —6}, grad g? (25) — {4, —2}. 


le cône Æ indiqué dans la remarque 37.12 a ici la forme d’un angle 
entièrement contenu dans le demi-plan supérieur (fig. 151). Le vec- 
teur grad F° (z,) — {0, 1} possède un produit scalaire positif avec 
chacun des vecteurs ô2 dont la direction appartient au cône K, ï.e. 
le long de chaque demi-droite issue du point z, et pénétrant à l’inté- 
rieur de l’ensemble E” la fonction FÆ° (z) estcroissante dans 
un voisinage du point z,. Autrement dit, la condition indiquée dans 


le théorème 37.11 est satisfaite au point z,. 
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Néanmoins, le théorème 37.11 est ici inapplicable, puisque la 
fonction g? (z!, z?) n’est pas convexe. En effet, au point (4, —2) 


qui appartient également à l’ensemble &” (fig. 192), la fonction 
F9 (z) prend une valeur plus petite qu’au point Z,: 


F9 (0,0) = 0, F0 (4, —2) = —2. 
Cet exemple nous montre que la condition de convexité des fonc- 


tions g° (z), à € J (z6) imposée dans le théorème 37.11 (ou dans le 
théorème 37.10) est essentielle. (11 est facile de trouver un exemple 





Fig. 153 


qui montre que la condition de convexité de la fonction Æ° (z) est 
également essentielle.) Remarquons que dans l’exemple considéré 
la fonction F° (z) atteint au point z, — (0, O0) un minimum local, 
i.e. sa valeur au point z, est la plus petite des valeurs que peut pren- 
dre la fonction FÆ° (z) sur l’ensemble £” AN Z., où 2, est une boule de 
rayon € suffisamment petit et de centre z,. Mais le théorème 37.11 
{de même que les autres théorèmes de ce paragraphe) se rapporte au 
minimum absolu de la fonction F° (z) restreinte à l’ensemble &”, i.e. 
au minimum de la fonction F° (z) non pas dans un voisinage du point 
50, mais sur tout l’ensemble &”. 

Rémarque 37.14. Si toutes les fonctions dans les pre- 
miers membres des inégalités g” (z) < 0 sont convexes (et non seule- 
ment celles qui correspondent à des restrictions actives au point 2), 
alors l’ensemble £”, comme on le voit aisément, est convexe. 
Mais si seules les fonctions qui correspondent aux restrictions actives 
au point z, sont convexes, alors l’ensemble Æ” du théorème 37.11 
peut aussi bien être non convexe (fig. 153). 

Remarque 37.15. Les conditions nécessaires et suffisantes 
trouvées dans cette section sont une généralisation des méthodes clas- 
siques de la recherche des extrémums à l’aide de la première et 


deuxième dérivée. Considérons, par exemple, le théorème 37.10 dans le 
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cas particulier où £ = q = 0, i.e. lorsque le domaine de définition 
de la fonction F° (z) coïncide avec tout l’espace £7. Nous obtenons 
alors l’assertion suivante. Soit F9 (z) une fonction convexe définie sui- 
ET; pour que la fonction F9 (z) atteigne son minimum au point 20, il 
faut et il suffit que l’on ait l'égalité grad F° (z,) — 0. C’est la condi- 
tion classique de minimum ; l’égalité grad Æ° (z,) — 0, i.e. l’annula- 
0F0 Go). 
ôzi 
condition classique nécessaire d’extrémum, tandis que la 
convexité de la fonction (qui impose des condilions bien déterminées 
sur les deuxièmes dérivées; comparer aux pages 319-320) 
nous garantit l’existence d’un extrémum (et plus précisément d’un 
minimum) au point Z. 

38. Principe du maximum. À présent nous énoncerons plusieurs 
théorèmes, réunis sous le titre général de « principe du maximum ». 
Ces théorèmes donnent des conditions nécessaire et suffisante d’ex- 
trémum, équivalentes aux théorèmes précédents, mais différentes de 
ceux-ci par la forme. 

Nous considérerons à nouveau, comme dans le théorème 37.11, 
le problème du minimum de la fonction Æ (2) restreinte à l’ensemble 
Q"N =", Q’ étant le plan déterminé par Los équations F° (z) — 0, 
= L: , k, où les fonctions F1, . FF sont affines; les hypo- 
thèses concernant la fonction #0 (2) et l'ensemble &” seront indi- 
quées ci-dessous. Considérons, d’une manière analogue au théorème 
37.11, le vecteur auxiliaire 4 — {W,, 1, . . ., W4} et introduisons 
la fonction 


H = H (2) = ol (2) + Et (2) +... + pet (2. (38.1) 


L'introduction de cette fonction permet de simplifier la condition 
(B) du théorème 37.11 : 

ôz grad A (29) L O0 pour tout vecteur Ôz dont la direction appartient 
au cône K déterminé par l'inégalité (z — z,) grad g° (2) 0, j € 
€ J (20). 

Autrement dit, la dérivée de la fonction Æ au point z, dans une 
direction quelconque qui pénètre dans le cône Æ est non posi- 
tive. Il semble que (pour les valeurs 4,, 11, . . ., w, dont l’exis- 
tence est affirmée par le théorème 37.11) la fonction H décroît 
(plus exactement, n’est pas croissante) lorsque nous nous déplaçons 
du point z, à l’intérieur du cône K, i.e. la fonction Æ sur le cône 
(et donc également sur l’ensemble Æ” € X) atteint son ma xi- 
mum local au point z,. En outre, on peut s'attendre à ce que 
la fonction Æ restreinte à Æ” atteigne au point z, son maximum 
absolu: puisque la fonction Æ°(z) est convexe, la fonction 
Vo (z) est concave (car %, << 0), et donc, les fonctions F1 (2), 

FF (z) étant affines, la fonction H sera également concave 


(fig. 154). 





tion des dérivées partielles — 1, ,.., n, coïncide avec la 
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Ainsi, nous sommes arrivés à l'hypothèse suivante: pour que 
(les conditions du théorème 37.11 étant satisfaites) la fonction F° (2), 
restreinte à l’ensemble Q" (] =”, atteigne son minimum au point 29, il 
faut et il suffit qu’il existe un tel vecteur % = {bo, Vi, . - ., Vz} que 
Ÿ, << 0 et que la fonction H de la variable z définie par Tr égalité (38.1) 
atteigne son maximum au point z0 sur l’ensemble &”. 

Remarquons que la suffisance de cette condition se dé- 
montre trivialement (et ceci sans aucune restriction sur l’ensemble 
=" et les fonctions F1 (2), F* (z) qui déterminent l’ensemble 
Q'). En effet, sur l'ensemble Q (et donc sur Q”N =”) toutes les fonc- 
tions FT (2), , F* (z) s’annulent et, par nn la fonction 
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Fig. 154 


H sur l’ensemble Q°’ N £” se réduit à l’expression 14,7 (2). Mais il 
est alors évident que si la fonction Æ restreinte à Æ ” atteint son maxi- 
mum au point Z,, alors cette même fonction, i.e. 4,7" (2), restreinte: 
à l’ensemble Q° N E” atteint a fortiori son maximum au point Z,, 
d’où l’on déduit que #° (z) restreinte à Q°f] E” atteint son mini- 
mum au point Z, (car Yo << 0). 

Au contraire, la nécessité de la condition énoncée ci-des- 
sus n’est pas évidente car on affirme que la fonction Æ atteint au 
point z, son maximum non seulement sur l’ensemble Q’ AN &” qui 
vérifie La relation Æ — 1%,F° (z), maïs sur l’ensemble E” tout 
entier. Montrons qu'avec les restrictions imposées dans le théo- 
rème 37.11. la nécessité est également vérifiée, i.e. on a le théorème 
suivant, qui confirme la validité de l’hypothèse formulée. 

Théorème 38.14 (principe du m a X i mu m). 
Supposons donné dans E" un plan Q° déterminé par un système d'équa- 
tions linéaires F'(z) — 0, i—1, ...,k, Les vecteurs orad F1, 
i = 1,..., k, étant linéairement indépendants, et soit E” l’ensemble. 
déterminé par les inégalités g° (z) L 0, j — 1, ..., p. Soit ensuite: 


un 


z, un point de l’ensemble Q°[\ "et F° (2) une fonction définie sur un 
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rer) 1! 


ensemble qui contient E" et satisfaisant à la condition (a) (ou (a')) 
(voir page 331). Supposons que toutes les fonctions g” (2), jE JT (2) 
sont convexes et régulières. Enfin, supposons qu’il existe un point 
z1 € Q”, dans lequel tous les produits scalaires 


(21 — 20) grad g/ (20), j € J (20) 


sont négatifs. 

Pour que la restriction de la fonction F (z) à L'ensemble Q' AN &” 
atteigne son minimum au point 29, il faut et il suffit qu’il existe un tel 
vecteur % = {Wo, V1, + - «+, We} que W)<0 et la fonction H (z) définie 
par la formule (38.1) et restreinte à l’ensemble ÆE" atteigne son maximum 
au point 20. 

Démonstration. La suffisance, comme nous avons 
remarqué ci-dessus, est évidente. Démontrons la nécessité. Supposons 
que la fonction Æ° (2), restreinte à l’ensemble Q7N £”, atteint son 
minimum au point z,. [l existe alors un vecteur + — {W,, Y., 

., Ÿr} qui satisfait aux conditions («) et (B) du théorème 37.11 
{car nous avons ici imposé les mêmes conditions que dans le théo- 
rème 37.11). Démontrons que ce vecteur est justement le vecteur 
cherché. 

Soit z un point de l’ensemble &” dans lequel la fonction F° est 
définie. Comme cette fonction Æ° (z) vérifie la condition (a) (page 
9931), on a f° (z) < F9 (z), où f° est la fonction affine dont l’existence 
est affirmée par la condition (a). Vu que 4, << 0, nous obtenons (voir 
(37.1) et (37.2)) 


H (2) — A (20) = VoP° (2) + biF1 (2) +... pr (2) — 


— Pol (20) — Ÿ1F7 (20) — YF" (20) < 
Po? (2) + pal (2) +. + pa? (2) — 
— Ÿof° (20) — V1F1 (20) — . . . — Pr F* (20) — 


= Vo (f° (2) — Ÿ° (20)) + Va (FT (2) — FT (20) + 
+ De (FF (2) — F* (20)) = Vo (Z — 20) grad f° + 
Pa (2 — 29) grad FIL... Lp, (z— 29) grad F* = 
= (2— 20) (bograd f° + 1 grad F1+ ... +1 grad F*) = 
= (2— 20) (Vo grad F° (20) + 1 grad FT +... +; grad F*). 


Mais la dernière expression est non pos i tive d’après la con- 
dition (f) du théorème 37.11, puisque z2€ € Le K, où Æ est le cône 
déterminé par les inégalités (z — 29) grad g° (2) KL O0, j ET (z), 
et donc la direction du vecteur ô£ — z — z, appartient au cône K. 
Par conséquent, A (2) — H (2,4) L 0, i.e. H (2) LH (45). Mais 
si le point z € Æ” était arbitraire, la fonction 71 (2) restreinte à l’en- 


rs // 


semble Æ ” atteint son maximum au point 2,. 
0 
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D'une manière tout à fait analogue (mais en se servant du théo- 
rème 37.11 et du théorème 37.7 où q — ! = 0); on démontre l’asser- 
tion suivante: 

Théorème 38.2 (principe du maximum). Soit 
Q" l’ensemble déterminé dans l'espace E" par les équations 


FÉG) = 0 24 F0 =0, 
et 2° l’ensemble déterminé dans E” par les équations 
Gl(z) — 0, ..., G (2) = O0, 


où (2), ..., F* (2), G (2), . .., G' (2) sont des fonctions affines 
non constantes. Soit, d'autre part, l'ensemble déterminé par les iné- 


£galités 
gl (2 O0, ..., g° (2) L 0 


où gl (2), ..., g? (z) sont des fonctions convexes régulières. Soient 


enfin 1, . .., Em des ensembles de l'espace E" et F9 (z) une fonction 
dont le domaine de définition contient l’ensemble 


S—s'nESNE F 
Lead eme eme ed 1 . + md N° 


Supposons qu'au point z0 € Q'(\ E la fonction F9 (z) satisfait à la 
condition (a) (ou (a')) (page 331) et que l’on se donne des cônes N;, . .. 

, Nm de sommet 2, qui satisfont à la condition (c) (page 333). (Par 
exemple, ces conditions sont remplies si les ensembles X,, . . ., E4, sont 
convexes et N,, ..., N, sont les cônes d'appui de ces ensembles au 
point 20.) Nous allons supposer que tous les vecteurs grad g? (20), j € 
€ J (z,) sont non nuls. Posons K; = Ker F', i—=1,...,k; L; — 
EL SO NC EC PRE désignons par P; le demi-espace déter- 
miné par v inégalité (z — 2) grad g? (20) < 0 et supposons, en plus, 
que Le système de cônes convexes 


Rte. k), Let ser es r), 
P;G ET (&)); N;G = 1,  . m) 


ne possède pas dans E” la propriété de séparation. 
Pour que la fonction F° (2) restreinte à l’ensemble Q" (\ # atteigne 
son minimum au point 20, il faut et il suffit qu’il existe un tel vecteur 


d = Lo, Vi, . . ., Var} que Ÿo < 0, et la fonction H (z) définie par la 
formule (38.1) et restreinte à l' ensemble E atteigne son maximum au 
Point 2. 


Enonçons enfin le principe du maximum dans le cas où l’ensem- 
ble Q est donné par des équations linéaires et des restrictions convexes. 

Théorème 38.8. Soit Q' l'ensemble déterminé dans l' — E" 
par les équations F*(z) = 0, i=1, k, où F1 (2), , FF (2) 
sont des fonctions ajffines non constantes. Soient, d'autre part, E en os 
... cm des ensembles de l’espace E" et F (z) une fonction dont le do- 
maine de définition contient l’ensemble E — EN ...N Em. Soit, 
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enfin, &" l'ensemble déterminé par les inégalités f? )< 0; = 1, 

., q, Où f'(z), ..., ff (z) sont des fonctions convexes régulières, 
le domaine de définition de chacune contenant l’ensemble E. Suppo- 
sons qu’au point 29€ Q° AN Q"N E la fonction F1 (2) satisfait à la 
condition (a) (ou (a”}) (page 331) et que l’on se donne des cônes N,, ... 

» Nm de sommet z, vérifiant la condition (c) (page 333). Nous allons 
supposer que les vecteurs grad f” (25), j € T (20), sont non nuls. Posons 
K; = Ker F", i—=1,..., k, et désignons par Il; le demi-espace dé- 
terminé par l'inégalité (z — z,) grad f? (z,) < 0, et supposons, en 
outre, que le système de cônes convexes 


K;(G=1,...,k), I;GET(z)), NaR=1,..., m) 
ne possède pas dans E" la propriété de séparation. 


Pour que la fonction F (2), restreinte à l’ensemble Q" AN Q"NE, 
atteigne son minimum au point z0, il faut et il suffit qu’il existe des 


nombres 9; Vus + « ., x et des nombres non positifs À, . .., À tels 
que l’on a les conditions suivantes : 
(a) Po < 0; 
k q 
(B) la fonction H (2) = D VFt(2)+ D Af (2) restreinte à 
a=0 j=1 


l’ensemble E atteint son maximum au point 20: 
(y) Af * Go) =... = Àgff (20) = 0. 


Démonstration. Supposons que les conditions (æ), (B}, 
(y) sont remplies. Prenons un point z € Q'N Q”fN €. Alors, H (2) < 
< H (z,) (en vertu de la condition (f)). Comme toutes les fonctions 
Fi (2), , F* (z) s’annulent sur l’ensemble Q’ (et en particulier 
au point 2) on voit, d’après la condition (y), que cette dernière iné- 
galité se met sous la forme 


of (2) + SA (2) Po F° (20) 
Ainsi, 
Po (F0 (2) — F0 (z6)) K —EZ jf (2) K 0 


i.e. d’après (a), nous avons Æ° (z) — F0 (z,) > 0. Mais cela signifie 
justement que la fonction F° (z), restreinte à l’ensemble Q1N Q”N 
NM %, atteint son minimum au point z,. Donc, la suffisance 
des conditions énoncées est établie. 
Démontrons leur nécessité. Supposons que la fonction 
FT (2), restreinte à l’ensemble Q' NA "AN #, atteint son minimum 
au point z,. Il existe alors des nombres ,, ,, . . ., VW, et des nombres 
non positifs À;, j € Î (29) qui satisfont aux conditions (æ}, (B) du théo- 
rème 37.7 (pour r —p = 1 = 0). Posons À; = 0 pour j & Z (z,) et 
montrons que les nombres ainsi obtenus bo. Vu; Ur. 
, À Satisfont aux conditions (œ), (B), (y) du théorème 38.3. La 
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condition (æ) coïncide avec la condition (œ«) du théorème 37.7; elle 
est donc vérifiée. La condition (y) est également satisfaite, puisque 
pour j € TZ (z,) nous avons f? (z,) — 0, et pour jÉI (z9) À; — 0.Il 
reste à démontrer la validité de la condition (6) du théorème 38.8. 
Soit z un point de l’ensemble &, de sorte qu’en ce point toutes Les 

fonctions Æ° (z), f! (z),..., f? (z) sont bien définies. Mais si la fonc- 
tion FÆ (z) satisfait à la condition (a) (page 331), on a f° (z) < F° (2), 
où f* est une fonction affine dont l’existence est affirmée par la condi- 
tion (a). En tenant compte de l'inégalité 4, << 0, nous trouvons (voir 
(37.1), (37.2)): 

H (2) — H (20) = Vol (2) + Ft (2) + pa F (2 + 

+ Mf (2) + 4 + ff (2) — Vol? (20) — P1F (20) — - —}F* (Zo) — 

— M f (Zo) — : : + — hf (20) L'Vo (° (2) — 2 (20)) + 

2 da (FL (2) — F4 (20) + «22 + ne (F% (2) — F (20)) + 


7 : 
+ 2 à (F (2) —f (25)) = Vo (2 — 20) grad ÿ° + 


q 
+ 2 be (20) grad Fe À AP (2) = 
R 


= À ve (2— 20) grad Fa) + 2 AP (0). 


3€1(20) 
La fonction f? (z) étant convexe, on a, pour j € I (2), 
f (2) = f (2) — F (20) > (z — 20) grad f” (2) 
{comparer aux pages 331-333), et donc, ayant en vue l'inégalité 
À, < 0, nous obtenons 


k 
A (z) — À (29) < 2 Ya (2— 20) grad F © (20) + 
À; (z— 2%) grad f? (20) — 


JE1(z0) 
k 
=(Y pagrad F*(2)+ D À; grad jf? (2)) (2 —20). 
a—0 JET (20) 


Mais le deuxième membre est non positif d’après la condition 
(BP) du théorème 37.7, puisque zEECN,N ...fN#N,,et donc la 
direction du vecteur z — z, appartient au cône V,f] .../f NV. 
Par conséquent, H (2) — H (25) < 0, i.e. H (2) < H (2). 

Dans le théorème démontré (de même que dans le théorème 38.2), 
on peut supposer qu’une partie des ensembles E,, ..., Æ, et des 
cônes W,, ..., N,, satisfait à la condition (c’}, une partie à la con- 
dition (c") et les autres satisfont à (c). De cette manière, le théorème 
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88.3 prend la forme d’un théorème plus général (comparer au théo- 
rème 88.2) mais nous ne l’énoncerons pas sous cette forme. 

Remarque 38.4 On voit de la démonstration qu'il suffit 
d'exiger, dans le théorème 38.3, la convexité et la différentiabilité 
des fonctions f? (z) seulement pour j € I (z,). 

Remarque 38.5. Si dans le théorème 38.3 on exige seule- 
ment la convexité locale des fonctions °° (z) et f* (2), i € I (20), 
au point Z,, on obtiendra alors les conditions nécessaire et suffisante 
de minimum local, i.e. du minimum de la fonction Æ° (2), restreinte 
à l’ensemble ZX, N Q°N Q”N EE, où Z, est une boule de rayon r 
suffisamment petit et de centre z, (et l’on doit alors envisager le 
maximum de la fonction À (z) seulement sur l’ensemble ZX, f} &). 
Mais il est clair que la condition nécessaire d’un minimum local 
est à la fois une condition nécessaire de minimum absolu (i.e. du 
minimum de la fonction Æ°(z) restreinte à tout l’ensemble 
Q'N Q"NE). 

Ainsi, si l’on n’exige que la convexité locale des fonctions Æ° (z} 
et f” (z), i E T (z,) au point z, et l’on remplace la dernière condition 
par l’hypothèse suivant laquelle la fonction Æ (2) restreinte à l’en- 
semble Æ atteint son maximum local au point z,, alors on obtiendra 
du théorème 38.3 une condition nécessaire de minimum (abso- 
lu). De le même manière on peut obtenir une condition nécessaire de 
minimum (absolu) sous forme de principe du maximum à partir des. 
théorèmes 38.1 et 38.2. 

Exemple 38.6. Soit F°(z) une fonction convexe régulière, 
définie dans un ensemble ouvert de l’espace £”, et soit & un ensem- 
ble convexe, contenu dans le domaine de définition F (z). Soit, enfin, 
Q” un certain plan et z, € Q”° NN #. Désignons par N le cône d'appui de 
l’ensemble convexe Æ au point z, et supposons que Q” et N sont insé- 
parables dans £”. Choisissons des fonctions affines F1 (z), ..., F*(2} 
aux gradients linéairement indépendants, telles que 


Q' = (KerFt)fN ...fN (Ker F7". 
On voit alors que le système de cônes convexes 
Ker F1, ..., Ker FF, N 


ne possède pas dans £” la propriété de séparation, i.e. toutes les con- 
ditions du théorème 38.2 (dans lequel il faut maintenant poser r — 
— p —=0, m = 1) sont remplies. 

Par conséquent, pour que la restriction de la fonction Æ° (z) à l’en- 
semble Q° N £€ atteigne son minimum au point 2,, il faut et il suffit 
qu'il existe un vecteur 4 — {Wo, V1, . . ., Yx}, tel que wo << 0, 
et une fonction À (z) déterminée par la formule (38.1) et restreinte 
à l’ensemble E atteint son maximum au point z,. On peut en même 
temps supposer que Ÿ, — — 1. 
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Donnons une interprétation géométrique de l’assertion énoncée 
(fig. 1495). Désignons par Æ£"*1 l’espace de dimension nr + 1 conte- 
nant Æ£" et introduisons dans £”*! un système (orthonormé) de coor- 
données z!, ..., z", z"*l, telles que l’hyperplan z°*! — 0 coïncide 
avec E". Notons W le graphique dela fonction z**1 — F (z) 
restreinte à l’ensemble &, i.e. l’ensemble de tous les points (z!, . .. 
..., 2, 25, pour lesquels le point z — (z!l, ..., z*) appartient 
à & et F0 (z) — z"*1, Soit ensuite Q* le plan de £"*! parallèle à Q” 





Fig. 155 


et passant par le point 2* — (zl, ..., z,, F9 (z5)) E W (où z,, ... 

., Zj sont les coordonnées du point z, dans £"). Enfin, désignons 
par [ l’hyperplan de l’espace Æ"*1 qui joue le rôle de graphique de la 
fonction z**1 — ® (z), où 


D (2) = Et (2) +... HE (2) + F9 (20). (38.2) 


Si Ft(2) =...—=F# (7) = 0 pour z € Q’ (et en particulier pour z — 
= Z,), on a D(z) = F° (z,) pour z € Q’. Donc, l’hyperplan l con- 
tient le plan Q*. 

Remarquons maintenant que A (z,) — —F°(z,) et 


F9 (2) — ® (2) = À (20) — H (2). 


Par conséquent, le fait que la restriction de la fonction Æ (z) à l’en- 
semble # atteint son maximum au point z, implique l'inégalité 
F9 (3) > © (z) sur l’ensemble E et l’on voit donc que l’ensemble 
W est situé dans ET au-dessus de l’hyperplan l (ï.e. dans 
le demi-espace z**! => © (z)). 
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Réciproquement, s’il existe un tel hyperplan FT passant par le 
plan Q* que l’ensemble W est situé au-dessus de F', alors l'est déter- 
miné par une équation de la forme z"*! — ® (z), où la fonction 
® (z) s'écrit sous la forme (38.2), et par conséquent l'inégalité 
H (2) < H (25) est satisfaite sur l’ensemble &. 

Ainsi, pour qu'une fonction convexe régulière F9 (2) restreinte à l’en- 
semble Q" N E (où & est un ensemble convexe contenu dans le domaine de 
définition de la fonction F° (2) et non séparable du plan Q' € E") attei- 
gne son minimum au point z0 € Q'NE, il faut et il suffit qu'il existe 
dans l’espace E"*1= E" un tel hyperplan T que le graphique de la 
Jonction 2°"*1 — F9 (2) restreinte à l'ensemble Æ soit situé au-dessus de 
T et en même temps T contienne le 
plan Q* parallèle à Q' et passant 
par le point z* — (2, F9 (2)). 

Cette assertion (géométrique- 
ment assez évidente) (voir fig. 155) 
nous sert donc d'illustration du 
principe du maximum dans le cas 
considéré. 

39. Méthode de programmation 
dynamique. Nous allons décrire 
une méthode de recherche du mini- 
mum complètement différente des 
méthodes envisagées précédemment ; 
on l’appelle méthode de programma- 
tion dynamique. Cette méthode re- 
monte aux travaux de R. Bellman. 

Pour saisir l’idée de la méthode, voyons une autre solution du 
problème posé dans l’exemple 7.1 de la page 48. 

Exemple 39.1. Trouvez le minimum de la fonction (7.4), 
restreinte au rectangle —1 L<r <3, 0< y< 2. 

Solution. Donnons à la variable x une valeur fixe (ap- 
partenant au segment —1 < x < 3) et considérons F comme une 
fonction d’une seule variable y (qui varie dans le segment 0 << y < 
< 2). Désignons la valeur minimale de cette fonction par © (x) 
(fig. 156). Ainsi, pour tout y qui satisfait aux inégalités 0 < y < 2. 
on à la relation F'(x, y) > © (x) et il existe sur le seoment 0< y <2 
au moins un point dans lequel l'égalité F(x, y) — «© (x) est 
atteinte. Le nombre © (x) est défini pour tout x appartenant au seg- 
ment —1 < x < 3, i.e. © (x) est une fonction définie sur ce segment. 
Désignons par m le minimum de cette fonction. 

Il est facile de comprendre que m coïncide avec la valeur minima- 
le de la fonction F (x, y) sur le rectangle considéré. En effet, lorsque 





m— min @(x), 
—1<x<3 
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on peut trouver sur le segment —1 < x < 3 un tel point x, que l’on 
a © (x9) = M. D'autre part, si 
O(t)= min F (xs y), 
0<y<2 
on peut trouver sur le segment 0 <y<2 un point y, tel que 
F (to, yo) = © (to), ie. F'(to, yo) = m. Par ailleurs, pour tout 
point (x, y) du rectangle considéré, nous avons 
F (x, nz 7 ni A y)=o@(x)> min (x) —m. 

1<SXx<S3 
Ainsi, F (x, y) > m pour tout point du rectangle, et il existe au 
moins un point 0. Yo) pour lequel F'(x,, yo) — m. Mais cela si- 
enifie justement que m» est le minimum de la fonction F. 

Il découle des considérations ci-dessus que la valeur minimale 
de la fonction F (x, y) peut être recherchée en deux étapes: on trouve 
d’abord la fonction © (x), puis l’on détermine sa valeur minimale. 
Abordons la réalisation de ce projet. 

Pour trouver la fonction 

o(x)= min F(x,y), 
O0 LY< 
annulons la dérivée partielle F, de la fonction F (voir la deuxième 
relation (7.6)). Evidemment, si x=£ 0, la dérivée F,, ne s’annule qu’au 
point y = 1. Par conséquent, pour x = 0 fixe, la fonction F (x, y) 
peut atteindre son minimum sur le segment 0 < y < 2 soit au point 
y — À, soit aux extrémités du segment, i.e. pour 0 OUY = 2; 
Autrement dit, © (x) est le plus petit des trois nombres: F (x, 0), 


F (x, 1), F (x, 2) (et cette assertion est également valable pour 
zx = 0 car F' (0, y) = 3 — const). D’après (7.4), 


F(x, 0)=Fi(x, 2)= La +2 4 +3; 
) (39.1) 
F'(x, 1)= + 2f+3. 


Comme la fonction x? — 4x — x (x — 4) est positive pour —1 < 
< x < 0 et négative pour 0 Lx L 3, nous obtenons l'expression 
suivante pour la fonction « (x): 


La +3 pour —1<x<0, 
O (x) = 
Sata 4r+3 pou Or. 


Il est maintenant évident que la fonction « (x) peut prendre sa va- 


leur minimale soit dans l’un des points x — —1, x — 0, x — 3, 
soit dans les points où sa dérivée s’annule, i.e. aux points x — —2, 
æ = À. Mais le point x = —2 n'appartient pas au segment — 1 


23—01208 
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Z x L3. Par conséquent, il ne reste qu’à comparer les nombres 
© (—1), © (0), © (1), © (3). Par calcul direct on voit que le plus petit 
d’entre eux a la valeur © (1) — ?/,. Par conséquent, le minimum de 
la fonction F# (x, y) est égal à m — ?/,; d’après (39.1), on voit que 
cette valeur minimale de la fonction F est atteinte en deux points: 
(1, O) et (1, 2). 

La méthode considérée se réduit au calcul successif des minimums 
d’une fonction d’une variable. On cherche d’abord le minimum 
de la fonction F'(x, y) d’une seule variable y pour une valeur fixe 
(mais quelconque) de x, on désigne ce minimum par © (x), et on cher- 
che ensuite le minimum de la fonction obtenue & (x) de la variable x. 

Cette méthode peut être appliquée également pour la recherche 
du minimum d’une fonction de plusieurs variables. En effet, soit 
F (21, ..., z°) une fonction définie sur un ensemble Q € £7. Fixons 
d’une manière quelconque les nombres 2° = 25, ..., 271 = 291 
et considérons la fonction F# (2, ..., 471, z d’une seule 
variable z° (elle est définie pour les valeurs de z” telles que le point 


(2, ..., z71, 7%) appartient à l’ensemble Q). La valeur minimale 
de cette fonction (qui dépend évidemment du choix des nombres 
zl, ..., 20 1) sera désignée par @n-1 (2, - - ., Z  ). Ainsi, nous obte- 
nons la fonction ©, (z!, ..., 2-1) de n — 1 variables z!, ... 
TE 
DC st min Pl (2 35.21 2" (39.2) 
ñn 


Z 


Fixons maintenant d’une manière quelconque les nombres 24, . .. 
..., 2j? et considérons la fonction @,1 (2, ..., 27, 271) 
d’une seule variable z*1, La valeur minimale de cette fonc- 
tion sera désignée par @h-2 (24, . . ., 25 *). Nous obtenons la fonc- 


tion @n-o (21, ..., 242) de n — 2 variables z1, ..., 272: 


Osk ist) min D sers are 2). 
n— 


En général, si l’on a déjà défini la fonction oz (z!, . .., z*) de k 
variables, on peut définir 1 (21, ..., 2*-1) comme le minimum 
de cette fonction relativement à la variable z* (les autres variables 
zl, ..., 2*-1 étant fixes): 
en . e AXL Q 
OT CP )= min D 282) (39.3) 
Z 


k—=2, ..., n—1. 
Ainsi, on définit successivement les fonctions 


met ses at aztet), cos (Ch sm), eo (C7, 27) of (2): 


(39.4) 
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La valeur minimale de la dernière de ces fonctions sera désignée 
par m: 
m — min @, (z!). (39.5) 
1 
Z 


Il est facile de comprendre que m est la valeur minimale de la fonction 
primitive F (2, ..., z). (Une formulation plus exacte et une dé- 
monstration de ce fait sont contenues dans le théorème 39.2.) Ainsi, 
la considération de la suite de fonctions (39.4) définie par les rela- 
tions de récurrence (39.2), (39.3) permet, grâce à la formule (39.5), 
de trouver la valeur minimale de m de la fonction F (21, ..., 7"), 
de sorte qu’en appliquant cette méthode il nous faut trouver le mi- 
nimum d’une fonction qui dépend seulement d’une variable. On 
appelle cette méthode programmation dynamique (appliquée à la 
recherche du minimum d'une fonction). 

Un avantage certain de cette méthode est son universalité (ï.e. 
son applicabilité à une large classe de problèmes). D’après la descrip- 
tion donnée ci-dessus, il est clair qu’il ne faut imposer aucune restric- 
tion à la fonction F (z!, ..., z") et son domaine de définition pour 
appliquer cette méthode. Ainsi, parmi toutes les méthodes considé- 
rées (et les autres), qui servent à la recherche des extrémums, la 
programmation dynamique est la plus générale. 

Un autre avantage présenté par cette méthode est le fait qu’elle 
permet de diminuer la dimension du problème considéré, i.e. elle ré- 
duit (dans le sens indiqué plus haut) le calcul du minimum d’une fonc- 
tion de plusieurs variables à la recherche successive de minimums 
de fonctions d’une variable. Maïs cet avantage n’est qu'un faux- 
semblant, car en règle générale, dans une vaste majorité de cas, il 
est en fait un inconvénient. 

C’est que les fonctions de la suite (39.4) deviennent de plus en 
plus compliquées, même lorsqu'on a une bonne expression analytique 
de la fonction primitive F (z!, ..., z*). Nous l’avons déjà vu dans 
l'exemple 39.1 où il y avait dans la suite (39.4) une seule fonction 
© (x) (— © (2): contrairement à la fonction primitive # (x, y), 
la fonction « (x) ne possédait pas d’une expression analytique u n i- 
que et se définissait par deux formules différentes sur les deux seg- 
ments qui formaient son domaine de définition. On peut donc s’ima- 
giner Ce qui Se passera en appliquant la méthode dans le cas général : 
le nombre de morceaux sur lesquels il faut définir de manière diffé- 
rente la fonction «4 (z!, ..., z*) va croissant lorsque Æ diminue, ce 
qui rend pratiquement impossibles les calculs nécessaires à l’applica- 
tion systématique de la méthode. 

En outre, quoiqu’en principe il s’agisse de trouver le minimum 
d’une fonction d’une seule variable, en réalité le problème se trouve 
compliqué par la présence de plusieurs paramètres (par exemple, pour 
trouver la fonction w, (z!, ..., 2-1) à l’aide de la formule (39.2), 


23% 
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il faut chercher le minimum d’une fonction qui dépend d'une seule 
variable 2°, maïs il s’agit de trouver ce minimum pour toutes les 
valeurs des paramètres z,, . .., 271). Et ceci est inévitable, puisque 
dans le calcul récurrent des fonctions (39.4) nous ne savons pas, jus- 
qu’au dernier moment (i.e. jusqu’à ce qu’on a trouvé le nombre m), 
quelles sont les valeurs des variables z!, . .., z* pour lesquelles la 
fonction F (z!, ..., z°) atteint son minimum. Il faut donc chercher 
(et retenir en mémoire) les valeurs des fonctions (39.4) pour toutes 
les valeurs de leurs arguments. 

Ainsi, dans le cas général, pour d’assez grandes valeurs de n, 
la méthode de programmation dynamique ne peut pas être appliquée 
entièrement, même à l’aide d'ordinateurs, car elle nécessite une 
trop grande quantité de calculs et un trop grand volume de mémoire. 
Ceci n’a rien d'étonnant: c’est qu'’essentiellement la méthode de pro- 
grammation dynamique présuppose la recherche de toutes les 
valeurs de la fonction F (z!, ..., z"). Ainsi, dans l’exemple 39.1, 
nous avons d’abord étudié les valeurs de la fonction F (x, y) sur 
chaque segment x — const (i.e. trié toutes les valeurs de cette 
fonction), après quoi, nous avons choisi la plus petite des valeurs 
minimales de la fonction sur ces segments. 

Le fait indiqué rend l'application de la méthode de programma- 
tion dynamique assez difficile. Cependant, on arrive parfois à faire 
appel à des considérations supplémentaires, qui permettent d’effec- 
tuer la solution jusqu’au bout par cette méthode. L'exemple 39.3 
en est une illustration. 

Enonçons et démontrons maintenant un théorème qui expose la 
méthode de programmation dynamique (appliquée à la recherche du 
minimum d’une fonction). Introduisons avant tout les notations né- 
cessaires. 

Soit F(zl, ..., z*) une fonction donnée sur l’ensemble Q & Er. 
Désignons par ET-1 l’espace des variables z!, . .., 2"! et par Q,., 
l’ensemble de tous les points (2, ..., 21) € ET hour chacun des- 
quels on peut trouver un tel nombre z"* que (z!, ..., z"1, 2n € Q. 
Autrement dit, le point (zl, ..., 21 appartient à l’ensemble 
Q,_ si et seulement si la droite, qui passe par ce point parallèle- 
ment à l’axe z°, possède des points communs avec l’ensemble Q. Sur 


l’ensemble Q,., définissons la fonction @,4 (21, ..., 2%?) par la 
formule (39.2), où le minimum est calculé sur toutes les valeurs de 
z" pour lesquelles (21, ..., 21 Z%) € Q. Nous allons supposer 
que la fonction @,-, (2!, ..., z*-1) est définie sur tout l’en- 
semble Q,_,, ji.e. que pour chaque point (2, ..., 2H €Q,. 
le minimum (39.2) existe. 

Supposons déjà construite (pour k — 2, ..., n — 1) la fonction 
Op (21, ..., z*) définie sur un certain ensemble Q, de l’espace E* 
des variables z!,..., 2%, Désignons par £*-1 l’espace des variables 


z!, .... 241 et par Q,., l’ensemble de tous les points (21, .. 
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., 241) € E1 jus chacun desquels on peut choisir un nombre z* 


tel que (21, ..., 2%-1, z%) € Q,. Sur l’ensemble Q, . définissons une 
fonction @©z 4 a; ..., 240) par la formule (39.3), où le minimum 
se prend sur toutes les de z*, pour lesquelles (21, ..., z*”1, 


28) € Q. Nous allons supposer que la fonction ©, (z 1, 2h 1) 


est définie sur tout l’ensemble Q,_.,, i.e. que pour tout Loin 
(1, ..., 21) € Q,_, le minimum (39. 3) existe. 

MR de l’existence des minimums (39.2), (39.3), (39.5) 
est la seule restriction imposée par la méthode de programmation 
dynamique. (Notons que cette hypothèse est toujours satisfaite si 
Q est un ensemble borné fermé de l’espace £" et la fonction F (z!,. 

., 2°) est continue sur Q.) 

Théorème 39.2 Soit F (21, ..., 2") une fonction définie 
sur l’ensemble QC E". Supposons que le minimum (39.2) existe pour 
le point (2h su ZE QE. Supposons, de plus, que pour chaque 
point (21, ..., 2-1 € Q,. le minimum (39.3) existe, k = 2, 

.., R — 1. Supposons enfin que le minimum (39.5) (sur l’ensemble 
Q.) existe également. Alors, le nombre m est le minimum de la fonc- 
tion F (21, ..., 2°) sur l'ensemble Q. D'autre part, le point 2, = 
— (2;,..., 2%) EQ sera un point où la fonction F (z!, ..., z") prend 
sa valeur minimale sur l’ensemble Q si et seulement si l’on a les rela- 
Lions : 


CES 0 CR 
= On-2 (22, ..., 2%)... =0@2(2,,3)—=@(zl)=m. (39.6) 
Démonstration. Pour tout point z — (z!, ..., z) € Q, 
on à 
Per 20) min (2.2) 0,404 %::,2%0) 
ñn 
Z 
On (st, .., 2) >minans(,...,1)= on (cl, ..., 202), 
n- 
@9 (21, 22) > min @o (21, 22) — oo, (2!) 


Ainsi, 
Prise) 0, (em uas) 
ZOn-2(21, ...,2—2)2>...>Zo(2!, 2) > (2m. (39.7) 


En particulier, F(z!, ..., 2% = m pour tout point (z!, 
2: 20 ÉQ. 
Démontrons qu'il existe un point (2, ..., 27) € Q pour lequel 


F (3, ..., z5) — m. Ainsi nous montrerons que m est effectivement 
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la valeur minimale de la fonction F (z!, ..., z") sur l’ensemble Q. 
En effet, on déduit de la relation (39.5) qu’il existe un nombre 
zl E Q, pour lequel &, (2) — m. D'autre part, de la relation 
4 (Z3) = min @» (24, 2?) 

2 

Z 
(voir (39.3)) on peut déduire l’existence d’un tel nombre z, que 
(25: 2) € 2, et @o (Z: Z6) — (2); 1.0. Oo (25: Z;) — m. D'une 
manière analogue, on démontre l'existence d'un tel nombre zÿ, 
que (2, 25, 2) € Q, et «3 (zl, 22, 25) — m, etc. En continuant ce 


procédé, on obtiendra enfin de tels nombres zi, ..., 2 que 
(24, . 21) EQ, 1 et On-1(24, - . ., 257) = m. Maintenant, de la 
relation 
1 n—1\ __ < 1 n—-1 n 
Dis) (és 22 2) 
n 
Z 
il découle l’existence d’un nombre % tel que (4, ..., z5) € Q et 
1 n—-1\ __ 1 n—-1 n 
Darren Jde, 2 a), 
i.e. À (2, ..., 25) — m. Par conséquent, m est le minimum de la 


fonction F (z!, ..., z") sur l’ensemble Q. 

Démontrons la dernière partie du théorème. Soit 2, = (z,, ... 
..., Z*) un point de minimum de la fonction F (21, ..., z"), i.e. 
F(z, ..., 2%) = m. Alors, dans les relations (39.7), on doit avoir 
partout des égalités (car, autrement, F (2, ..., z) > m), 
i.e. on a les relations (39.6). Réciproquement, si les relations (39.6) 
sont satisfaites, alors, en particulier, (2, ..., 22) — m, i.e. 
(24, . . ., 2%) est un point de minimum. 

Pour illustrer l’application de la méthode de programmation 
dynamique, considérons à nouveau le problème contenu dans l’exem- 
ple 9.2 (page 62). 

Exemple 39.3. Trouver n nombres non négatifs 2}, . .., 7" 
dont la somme est inférieure ou égale à a et qui possèdent en même temps 
un produit maximal. 

Solution. Il s’agit de trouver le minimum de la fonction 


PS es 20 mes is em (39.8) 
définie sur l’ensemble Q déterminé par les inégalités 
2>0, #>0,...,2>0, +4... +mM<a. (39.9) 


Calculons successivement les fonctions (39.4). Il est clair que 
l’ensemble Q, _, est déterminé par les inégalités 


210, ...,2—120, gb... Lai a. (59.10) 
Soit (z!, ..., z°1) un point de l’ensemble Q,.. Pour que le point 
zl, ..., 21, 7") appartienne à l’ensemble Q, i.e. satisfasse aux 


inégalités (39.9), il faut et il suffit que le nombre z° soit non néga- 
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tif et satisfasse à la dernière inégalité (39.9), i.e. l’on ait la relation 
OLz"<La—(z+...+znt, (39.11) 


Trouvons maintenant (en prenant le minimum sur le segment (39.11)): 


On (21, ..., 2 = min F (2, ...,2) =min(— 2...) — 
27 27 
= — max (ziz2.....20-129) = 7172... ,.70—1.maxz"— 
20 AL 

— — 3172... 2m l(a—(zi+...+zn-1)), (39.12) 
Recherchons maintenant la fonction &@,-9 (2, ..., z*?). On 
voit de (39.10) que l’ensemble Q, , est déterminé par les inégalités 
2120, 26220, Zen (39.13) 

Soit (21, ..., 272) € Q,,, et 210. Pour que le point (z!, 
bre Die 1) appartienne à l’ensemble Q,_1, i.e. satisfasse aux 


inégalités (39.10), il faut et il suffit que le nombre z°-! satisfasse 
aux inégalités 


OZz-1La—(zi+...+z—2), 


Désignons le nombre a — (2! + ... + 72) par c. Alors, le nombre 
z"-1 peut varier dans le segment 0 < z"1 cet, donc, 
His (ns) ML Ouf, aura me) 
0<z7"Î<e 
— min [—2tz.....20—l(a— (rit... +2 pzn-t))] = 
0<2 Î<e 
— min [—zt...z0-2.{zn-t(c—zn-t))] — 


oz l<e 


L C—Zx 
— min [st 2(x a (= )')|= 
0OLx<e 


c—zx\i c\2 
— —gl,,,7%-—2. max æ | ] | =—11...22. (5) — 
0Lx<cC 


— —2lz2.,,,..70—2. (=. +20) 








(nous nous sommes servis ici du lemme 9.1 pour 4 — 1). Ainsi 


Oo (zt, ..., 202) — —31,,,,.7n—2 ne) (39.14) 


Calculons maintenant la fonction &@,-3 (21, ..., z*#3). L'ensemble 
Q,_: se décrit par les inégalités 
20, 1 87720, zh. LT Lo: 


Soient (21, ..., 243) € Q,, et 220. Pour que le point (z!,... 
2", z%—2) appartienne à l’ensemble Q, _, (voir (39.13)), il faut et 


. 
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il suffit que le nombre z°-? satisfasse aux inégalités 
_—9 n-3 
Oz La—(z+... +27), 

Désignons le nombre a@ — (2! + .,., + 23) bar d. Alors le nombre 

peut varier sur le segment 0 < 7°? < d, donc, 
Ds (CRT) ne 2 Cris rie) 

= n [-#. ans (a Gt tan)? 
2 

je 


— min HE 71-38 (2-2 SE —) °) | — 


0<z-2<d 


- d— 
— min sr (ol 
0<x<d 








1-8 (Et Le +27) 


(nous nous sommes servis ici du lemme 9.1 pour Æ — 2). Ainsi, 





{ n-3 
_ = a — VA .. Z 
On-3 (2!, ace = 7, 708 (ER te) 
\ 3 
Continuant de la même manière, nous obtenons par récurrence 
"Tel R\i\n-k 
} k\ i R fa—(z+...-28) 
op (gt, ..., 2) at. eg (EEE : 
k£ — À, ee. + ] n — 4. 
En particulier, pour 4 — 1 nous aurons 
_yl\n-i 
(42 Z n 
: (Gi) — 


Par conséquent (l’ensemble Q, étant déterminé par l’inégalité 0 < 
<2< à) 


1 1 a— 21 An—i 

m— min @(2)— min — Z | = 
n—1 

Oz <a 0<z!<a 


— — max (z1 (= Fe) — (=) 
(ici on emploie le lemme 9.1 pour k — n — 1). Aïnsi, 
min F(z1,...,29= — (=), 


Q n 
i.e. le produit z!z?. . .. . z" atteint (pour les restrictions (39.9)} 
sa valeur maximale égale à (a/n)". A l’aide du lemme 9.1, on véri- 
fie facilement que cette valeur maximale n’est atteinte que pour 
ER — 7% — aln, ce qui correspond bien au résultat de 
l’exemple 9. 2. 








CHAPITRE V 


CRITÈRES D’OPTIMALITÉ DES PROCESSUS 
DISCRETS 


$ 11. Programmation dynamique 


40. Description de la méthode. Pour plus de simplicité, nous nous 
limiterons au problème fondamental (voir n° 3). Autrement dit, con- 
sidérons l’objet commandé 


z (D =f(xt—1), u(d), 1=1,...,N, (40.1) 


u(DEUr:(x(— 1), i1=1,...,N, (40.2) 
pour lequel l’état initial x (0) — x, est fixe, et nous n’imposons 
aucune restriction «sur les états ultérieurs x (1), ..., x (N). Le 
problème consiste à trouver un processus 

u (1), u (2), ..., u (N), (40.3) 
GO) AUD se m'ON), (40.4) 


qui satisfait aux conditions (40.1), (40.2), pour lequel la condition: 
initiale x (0) — x, est remplie, et qui minimise en même temps la 
fonctionnelle 


N 
J — 2h (x (t—1), u(t)). (40.5) 
1 


(Dans le cas du problème du maximum (au lieu du minimum) 
de la fonctionnelle (40.5), il faut remplacer le symbole du minimum 
par celui du maximum dans toutes les formules obtenues ultérieure- 
ment, et en particulier dans les formules (40.6), (40.7).) 

Définissons de la manière suivante les ensembles Q,, Q,, ... 
..., QY Situés dans l’espace de phase. L'ensemble Q, contient le 
seul point x,. L'ensemble Q,., étant déjà défini (pour 1 << NW), 
désignons par Q, l’ensemble de tous les points jf, (x, u), où x, u 
satisfont aux conditions x € Q,., u € U; (x) (la fonction f, et l’en- 
semble U;, sont indiqués dans les relations (40.1), (40.2)). Il découle 
immédiatement de cette définition que si le processus (40.3), (40.4) 
satisfait aux relations (40.1), (40.2), alors on a la relation x (rt) € Q: 
pour tous les £ — 0, 1, ..., N. 

Construisons maintenant par récurrence les fonctions x (x), 
Ov (X), . - ., @y( x), @, (x). Avant tout, posons ©, (x) = 0. La 
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fonction wx (x) est définie dans tout l’espace de phase £" (et en par- 
ticulier sur l’ensemble Q,). Supposons déjà construite la fonction 
&4 (x) (où 4 Li LAN) et définie sur l’ensemble Q; (ou sur un cer- 
tain ensemble qui contient certainement Q;). Définissons alors la 
fonction @+_1 (x) par la relation *) 


@r(x)= min (o (f(x, u))+fi(x, u)), (40.6) 
uEU, (x) 


où jf? sont les fonctions à l’aide desquelles s'écrit la fonctionnelle 
(40.5). Remarquons que pour tout x € Q;,_, le point f, (x, u) appar- 
tient (pour uw € U; (x)) à l’ensemble Q;, de sorte que l’expression sous 
le signe du minimum dans (40.6) est bien définie. Supposons mainte- 
nant (ce sera là la seule restriction imposée sur l’application de la 
méthode de la programmation dynamique) que la fonction w:, est 
définie sur tout l’ensemble Q;,_.,, i.e. que pour tout x € Q,_, le mini- 
mum dans le deuxième membre de la relation (40.6) existe. 

On appelle programmation dynamique la méthode de recherche 
des processus optimaux (pour les systèmes discrets) basée sur le théo- 
rème suivant. 

Théorème 40.1. Supposons donné le processus (40.3), (40.4) 
(à état initial x (0)) pour l'objet discret commandé (40.1),(40.2). Pour 
l'optimalité de ce processus (dans le sens du minimum de la fonctionnelle 
(40.5), l’état initial x (0) étant fixe et aucune restriction n'étant impo- 
sée sur les états x (1), . . ., x (N)), il faut et il suffit que pour chaque 
t—=1,..., Non ait la relation 


1h Ce (£— 1), u (D) + où (fe (x (t—1), u (0)) = 
— min (f(x(t—1),u)+ (fi (x(t—1),u)}). (40.7) 


uEU;(x(t — 1)) 


Démonstration. Montrons la nécessité de la con- 
dition (40.7). Supposons que le processus (40.3), (40.4) est optimal. 
Choisissons un Tt, 1<7T<WV, et un point vE U,;(xz(tT—1)). En 
utilisant ces valeurs, nous construirons un certain processus 


x (0), (1), ..., x(N); u(1), ..., u(N) 


à état initial x (0) = x (0) qui satisfait aux relations (40.1), (40.2). 
Posons tout d’abord 


z(t)=zx(t), u(t)=u(t) pour t—0, 1, ..., T—1. (40.8) 
Posons ensuite 


u(T=v, (= f @(T—1), u (1). (40.9) 


*) Cette relation s’appelle équation de Bellman ; dans notre exposition, cette 
« équation » est simplement la définition de la fonction «;. 
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Enfin, pour £ = t +14,..., N choisissons des points x (6), ü (#) de 
manière à satisfaire la relation 


Os (ec (£—1)) = où (fe Ce (— 1), ü ())) + 
+ (G(t—1),u(t), t=t+1, ..., N. (40.10) 
Il est aisé de voir qu’un tel choix de points x (&), u (t) (pour 
£=7T+1,..., N) est possible. En effet, substituons dans (40.6) 
les valeurs & = t + 1, x — x (x). Lorsque x (1) € Q., la relation 


(40.6) est vérifiée pour cette valeur de x. Par conséquent, il existe 
un point tel que 


u=u(T+1)€ Un (x (T)) 


la fonction atteigne son minimum (40.6), i.e. on a la relation (40.10) 
pour £ — t + 1. En nous servant de cette valeur de w (rt + 1), 
définissons x (t + 1) à partir de (40.1): 


t(t+1)= fur), u(r+01)). 


Nous avons ainsi déterminé les points cherchés u (t + 1), x (tx + 1). 
En substituant dans (40.6) les valeurs # = t + 2. x = x (x + 1), 


nous obtenons de la même manière u (t + 2), ensuite, x (rt + 2), 
etc. 


Ainsi, le processus x (t), u (t) est construit. D'après (40.1), la 
relation (40.10) se récrit sous la forme 
oi (fe (&(E— 2), u(t—1))) = 

= (f(@(t—1), u()+f (1), UD), t=T+1, ..., N. 
En prenant la somme de toutes ces relations pour tous les £ = tT + 
+ 1,..., N et en effectuant l'élimination des termes identiques 
du premier et du deuxième membres, nous trouvons (en prenant 


également en considération les formules (40.8), (40.9) et l'identité 
([Q) N = 0) : 


@ (fr (x (T— 1), v)) = 
= fu (D, u(T+ 1) +... +R (@(N—1), AN). (40.11) 


D'autre part, puisque x ({), u (f) est un processus o pt i m a 1, 
on a, par définition, 


f(x (0), u(1)) +... HN (z(N—1), u(N)< 
f(x (0), (1) +... +R (G(N—1), U(N)). 
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D'après (40.8), les premiers t — 1 termes des deux membres s’éli- 
minant deux à deux, nous obtenons ainsi 


héc(t—-1,u(t))+... + fr (x (N—-t),u (N))< 
LE (G(T— 1), U(D)+ 2 +R GUN — 1), AN), 
et cette relation se récrit à son tour sous la forme (voir (40.9), (40.11)): 
Je (r— 1), (0) + RG (N—1), u (ND < 
Lfi(z(r—1,v)+o, (f(x (T— 1), v)). (40.12) 


Rappelons que cette relation est vérifiée pour tous les t — 1, 
, N'etvEU,;(xz(t —)). 
Posons t — V dans (40.12). Nous obtenons (car w y = Ü) 


fx GC (N—1), u (N))<ÿN (x (N —1), v), vEUX (x (W—1)). 


Mais cela signifie justement que la relation (40.7) est satisfaite pour 


t = N. 
Supposons déjà démontré que la relation (40.7) est valable pour 
t— N,..., T7 +1. D'après (40.6), cette relation se récrit: 


f(a(—1),u()+o: (fix (t— 1), u(t))=o:1(x(t—1)) 
ou (voir 40.1) 
f(x(t—1),u (0) +o (f(x (1), u (0) = 0: (am G—2),u(t—1))). 
En prenant la somme de ces relations pour { — NV, ..., T + 
et en éliminant deux à deux les termes identiques à gauche et à droi- 
te, nous obtenons 
fin (ct), u(t+1)+...+ 7x (@(W—1), u(N)) = 
= 0% (fr (x (T1), u (D). 
Et, par conséquent, la relation (40.12) prend la forme 
fre (T— 1), u (T7) +or (f(x (rt —1, u(r))< 
<fr(r(t—1), v)+o (f(x (t— 1), v)). 


Mais cela signifie justement qu’on a la relation (40.7) pour £ = +. 
La récurrence effectuée démontre que l'égalité (40.7) est satisfaite 
pour tous les { — NV, ..., 1. Nous avons donc établi la nécessité 
de la condition (40.7). 

Démontrons la suffisance. Supposons que le processus 
x (t), u (t) satisfait à la condition (40.7) et soit x* (4), u* (£) un autre 
processus (satisfaisant aux conditions (40.1), (40.2)), avec le même 
état initial x* (0)=zx (0). Comme x* (4-1) € Q,_,, la relation (40.6) 
est satisfaite pour x —=x*(t—1): 


D (2* (—1))= min (or (fs (2 (1), u))+ft GT), w)). 


UEU ;(x#(t— 1)) 
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Et, par conséquent, on peut déduire de l'inclusion u* (4) € 
€ Ur (x* (4 — 1)) (voir (40.2)) l’inégalité 


O4 (2% (E— D) Ko (fe Ge (ED), nf ())) + (af CG — 1), u° ()). 
D'après (40.1) cette inégalité se récrit : 
O4 (2 (E—1)) Los (2% (6) + F5 (x (Et — 1), u* O)). 
Prenant la somme de ces relations pour £ = 1, ..., N, nous obtenons 
O9 (2* (0)) F1 (x* (0), u* (1)) +... HR (GG (NW — 1), u* (NW). 


D'autre part, en récrivant (40.7) sous la forme 


f(x (é— 1), u (rt) + où (x (t)) = où: (x ( —1)) 


{voir (40.1), (40.6)) et prenant la somme de ces relations pour { — 
— 1, ..., N, nous avons 


(x (0))= f(x (0), u (1) +... +fn(z(N—TD,u(N)). (40.15) 
Car x* (0) — x (0), on déduit des relations obtenues l'inégalité 
fi (æ (0), u (4) +... + (NW —-1), u(W)) < 
< fi (&* (0), u* (4) +... + fx (* (N — 1), uf (W)), 


qui signifie justement que le processus x (£), u (£) est optimal. 

Corollaire 40.2. La valeur minimale que peut prendre la 
fonctionnelle (40.5) pour le mouvement régi par la loi (40.1), (40.2), 
à partir de l’état initial x (0), est égale à &, (x (0)). 

En effet, cette valeur minimale est atteinte pour un processus 
optimal, i.e. un processus qui satisfait à la condition (40.7), et donc, 
d’après (40.13), elle est égale à ©, (x (0)). 

Dans le théorème 40.1, nous nous sommes servis d’une manière 
essentielle du fait que la fonction &;_, (x) est définie sur tout l’en- 
semble Q,_,, é — 1, ..., N, i.e. dans les relations (40.6) le mini- 
mum est atteint quel que soit x € Q,_.,. Le théorème 40.3 
(ci-dessous) indique une condition simple et applicable qui garantit 
l’existence du minimum (et, par conséquent, l’applicabilité de la 
méthode de programmation dynamique décrite dans le théorème 
A0.T). 

Pour énoncer le théorème 40.3, introduisons les notions néces- 
saires. Rappelons tout d’abord que l’ensemble A (situé dans l’espace 
E” des variables ul, . .., u’”) s'appelle compact s’il est fermé et borné. 

Supposons ensuite que M & E” est un certain ensemble et € 
un nombre positif ; on appelle e-voisinage de l’ensemble 7 l’ensem- 
ble qui contient tous les points de l’espace Æ” situés à une distance de 
ÀT inférieure à &. Autrement dit, le point x € Æ7 appartient au &-voi- 
sinage de l’ensemble A si et seulement si on peut trouver un point 
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a € M tel que la distance de a à x sera inférieure à e. Par exemple, le 
e-voisinage du cercle (dans le plan des variables ul, u?) est la 
région annulaire de largeur 2e; la fig. 157 représente le 
voisinage du triangle (considéré comme une ligne polygonale, 
l.e. sans points intérieurs). 

Enfin, nous dirons que l’ensemble U (x) (dans l’espace E? des va- 
riables ul, ..., u”) dépend continûment du point x € E", 
si la condition suivante est satisfaite : quel que soit le point x, € E*" 
et le nombre & > 0, il existe un & > 0 tel que pour tous les autres 
points x”, x” situés à une distance de x, inférieure à Ô, chacun des 
ensembles U (x'), U (x”) est entièrement contenu dans le &-voisinage 
de l’autre. La dépendance continue de 
l’ensemble U (x) en fonction du point 
x Signifie intuitivement que l’en- 
semble U(x) varie progressivement 
lorsqu'on déplace le point x. 

Théorème 40.3. Supposons 
que dans l'espace de phase ET" on se 
donne un certain ensemble G et des 
fonctions f; (x, u), f? (x, u) définies et 
continues pour x € Get u quelconque. 
Supposons ensuite que pour tout x € G 
l’ensemble U; (x) est compact et dépend 
continüment du point x. Supposons enfin 

Fig. 157 que pour tous les x£€G, uE U (x), le 

point f: (x, u) appartient à l’ensemble G. 

Alors les fonctions w; (x) sont définies et continues sur tout l’ensemble 

G; par conséquent, on peut appliquer le théorème 40.1, quel que soit 
l’état initial x (0) € G. 

Démonstration. La fonction wo, = 0 est évidemment dé- 
finie et continue sur tout l’ensemble G. Supposons déjà démontré 
que la fonction w; (x), où 1 Lt << N, est définie et continue sur 
l’ensemble G. Alors l’expression sous le signe du minimum dans la 
relation (40.6) qui détermine la fonction w;_, (x) est bien définie 
(car f; (x, u) € G) et représente une fonction continue. Lors- 
que u parcourt l’ensemble compact U;(x), x € G, cette fonc- 
tion, d’après le théorème d'analyse bien connu, atteint nécessaire- 
ment sa valeur minimale, i.e. le minimum (40.6) existe pour tout 
point x € G. Ainsi, la fonction w;_, (x) est définie sur tout l’ensem- 
ble G. Sa continuité se démontre sans difficulté (en se servant du fait 
que U; (x) dépend de manière continue de x). Ceci termine la récur- 
rence qui établit la continuité de toutes les fonctions ©; (x) sur l’en- 
semble G. 

Il reste à remarquer que pour tout état initial x (0) € G tous les 
ensembles Q,, ..., Q, sont contenus dans G (puisque f; (x, u) € G, 
quels que soient € G, u E U;(x)). Par conséquent, la fonction 
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o (x) est définie, en particulier, sur tout l’ensemble Q; (£—0, 14, ... 
..…, N), i.e. le théorème 40.1 est applicable. 

Remarque 40.4. Les conditions du théorème 40.3 étant sa- 
tisfaites, la valeur minimale de la fonctionnelle (40.5) dépend con- 
tinûment de l’état initial x (0) (car, d’après le corollaire 40.2, cette 
valeur minimale est égale à ©, (x (0)), alors que la fonction &, (x) 
est continue d’après le théorème 40.3). 

Nous terminons ainsi l’exposition de la méthode de programma- 
tion dynamique pour le cas du problème fondamental. Dans le cas 
du problème à restrictions sur les coordonnées de phase (en particu- 
lier, le problème à extrémités mobiles), on rencontre certaines com- 
plications peu importantes. À savoir, il faudra considérer, pour l’ob- 
jet (40.1), (40.2) les processus (40.3), (40.4) qui satisfont à la condi- 
tion x (t) € M}, quel que soit { — 0, 1, ..., N. Les états x (#) qui 
font partie des processus de ce genre remplissent un certain s o u s- 
ensemble de l’ensemble ;,. C’est ce sous-ensemble 
que nous désignerons par Q;. Dans la relation (40.6) on cherche le 
minimum pour tous les u € U} (x) qui satisfont à la condition sup- 
plémentaire f; (x, u) € Q,. Un changement analogue s'effectue pour 
la formule (40.7). Enfin, si l’ensemble Q, contient plus d’un point, 
il faut ajouter au système de relations (40.7) encore une condition 
supplémentaire évidente 


@9 (x (0)) — min &@, (x) 
xEQo 


(on peut supposer formellement que c’est là la relation (40.7) pour 

t — 0). Tels seront les changements dans l’énoncé du théorème 40.1. 

La démonstration reste la même (avec des modifications évidentes). 
Exemple 40.5. Considérons l’objet commandé 


2 =(—x (6-1) —2 (6 —1))u(, 


40.14 
& (D = 2 (6 — 1) + a (Et — 1), PER 
où w est un paramètre de commande scalaire qui doit prendre des 
valeurs dans le segment [0, 1]. Autrement dit, on étudie l’objet 
(40.1), (40.2) à espace de phase de dimension deux (i.e. n — 2), 
tel que 


fiat, a, u)=(l— a — a) u, fé(x, x?, u)= x + x, U; (x) = 10, 1] 


quel que soit £ — 1, ..., N. Posons pour cet objet le problème du 
maximum de la fonctionnelle (40.5), où 


f(a(t—1), u())= (GO) —x (1). 


Nous supposons que l’état initial x, est fixe et nous n’imposons aucu- 
ne restriction sur les états ultérieurs: en outre, le nombre À est 
donné. 
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Pour résoudre ce problème (i.e. trouver le processus optimal). 
il faut appliquer le théorème 40.1; remarquons que la possibilité 
d'appliquer ce théorème est garantie par le théorème 40.3 (où G coïn- 
cide avec tout le plan £? des variables xt, 2?). 

Par définition, 6x = 0. Ensuite, d’après (40.6) (où l’on prend, 
d’après la position du problème, le maximum au lieu du mi- 
nimum), nous avons 
On (2, 27)= max (ox (fn (z", 2°, u)) + fx (x', x?, u)) = 

uE[0, 1 
—= max ((u)?— x!) —=1— 7x1, 
uE[0, 1] 
le maximum étant ici atteint pour u — 1, de sorte que d’après (40.7) 
nous avons la relation uw (N) — 1 pour le processus optimal (quel que 
soit l’état x! (N — 1), x? (N — 1)). 
D'autre part, 


Op-2 (21, 27) = max (ox (frs (rt, 22, u)) + fn (xt, x, u)) — 


uE[0, 1] 
— max ({—(l-zt— ru +(u)} — xt. 
u€L0, 1] 
L'expression sous le signe du maximum dans le deuxième membre de 
cette égalité étant un trinôme du second degré relativement à u qui 
possède un coefficient positif en (u)?, on peut dire que cette expres- 
sion, restreinte au segment [0, 1], atteint son maximum dans l’une 
des extrémités de ce segment. Par conséquent, 
Oxo (at, 22) = max (1—(1—2t— x) u + (u) — xt) — 
u—0, 
—= max ({— xt, 2211), 
où le maximum pour 1 — xl > x? + 1 est alieint au point u = 0, 
et pour 1 — x! < x? + À au point u —1. D'après (40.7), cela si- 
gnifie que pour le processus optimal on a la relation 
O0 pour 1— zx (N—2)>x2(N—2) +1, 
4 pour 1—z2' (N—2)<La2(N—2) +1. 
(Ainsi, pour { — xt (N — 2) — 2x? (N — 2) + 1 les deux valeurs 
u (N — 1) = 0, u (N — 1) — 1 satisfont à la condition d'optima- 
lité.) 
D'une manière analogue, on calcule la fonction wx--3: 
Oxy-s (2°, 2°) = max (@x-2 (fx-2 (x, 2?, u)) + 
0 


9 


u (N—1) = | 


+ ho (at, 2°, u))= max ((u)—xt+ 
u€TL0, 1] 


—+- Max (1 — f\_ Ée Te, u), fN-0 CL?, D. u) a 1)) Te 
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— max ((u)2— xt max (1—(1—xt— 22) u, at 224 1)) = 
— “ax (max ((u)2— at +41 rt 22} u, (u)2 + x? + 1)) — 
: Le (ur A (at 22) u, (uÿ2Lx2 + 1)) = 
e ss (nex (}—at+1— (tai 27) 0), max ((u)?+ 22 +1) = 


— max (max (1— xt, x2+ 1), max (x? + 1, x242)) — 
— max (1— xt, x2 +2), 


Ici, pour 4 — xt > x? + 2, le maximum est atteint au point u = 0 
et pour À — xt & x? + 2 au point w — 1. D'après (40.7), cela si- 
gnifie que pour le processus optimal on a la relation 

O pour 1— zx (N—3)>x2(N —3)+2, 

4 pour 1—zxt(N—3)L22(N —3) +2. 


On voit donc qu’en calculant les fonctions wxy_+, ©xy-_3 nous 
n’avons pas encore la possibilité de trouver les valeurs de u (N — 1), 
u (N — 2) de la commande optimale; nous savons seulement com- 
ment elles dépendent de x (N — 2), x (N — 3) mais nous ne connais- 
sons pas encore ces dernières valeurs. 

Continuant de la même manière, trouvons les fonctions wo; (x!, x?) 
suivantes : 


© (xt, x?) — max (1 — xt, x? EN — 1 — À), 
L=N 220, as d:0 


u (N—2)= | 


où pour le processus optimal on a les relations 
0 pour 1—zxt()>r?(t) + N—t—1, 
a (+1) = | 1 1 (DE (+ Ni A. 
pour < 
En particulier, pour &é —0 nous obtenons 
0 pour x! (0)+-a?(0)< —(N—2), 
u (1) = | 4 pour xt (0) +22(0)> — (NV —2). 
Si le point x, — (x! (0), x? (0)) satisfait à la condition 
x! (0) + x? (0)  — (N — 2), 
alors uw (1) — 0, et l’on déduit donc de (40.14) que 
D 0: (Der (0) 72" (0): 
Mais alors, nous avons dans (40.15) pour £{ — 1 la condition s u- 


périeure (puisque x! (4) + x? (1) = x! (0) + x? (0) < — (N — 
— 2) << — (N — 3)) i.e. u (2) — 0. Par conséquent, d’après (40.14), 


2k—01208 


(40.15) 
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xt (2) — 0, x? (2) — x? (1). D'une manière analogue, nous trouvons 
le processus optimal : 


u (4)=u(2)= ... =u(N—1)=0, u(N)—1; 


(Der) (We D =0, 
24 (N) == 1 — (at (0) + 22 (D)) sb 
22 (1)—=2(2)= ... —2(N—1)—= 2 (N) = xt (0) + 2° (0). 


Mais si le point x, — (x! (0), x? (0)) satisfait à la condition 
æ' (0) + x? (0) > — (W — 2), 
alors u (1) — 1, et l’on déduit donc de (40.14) que 
x" (1) = 1 — x" (0) — * (0), x° (1) = x° (0) + x? (0). 


Mais alors x! (1) + x? (4) — 1, ï.e. (40.15) donne pour t = 1, la 
condition inférieure, et donc u (2) — 1. Par conséquent, 
d’après (40.14), x! (2) — 0, x? (2) — 1. De cette manière, nous 
obtenons le processus optimal 


u(1)=u(2)= ... =u(N—1)=u(N)=1; 
xt (1)=1— 21 (0) —22(0), xt(2)= ... =xt(N)—0; } (40.17) 
22(1)= xt (0)+22(0), 22(2)= ... —a2(N)—1. | 


Pour x!(0) + x? (0) — — (NW — 2) les deux processus (40.16) 
et (40.17) sont optimaux. 


41. Relations avec la théorie des extrémums des fonctions. Nous allons 
montrer comment on peut déduire le théorème 40.1 du théorème 39.2. 

Remarquons avant tout que le théorème 39.2 reste vrai si l’on comprend 
zl, ..., 2 comme un Le points de l’espace de dimension m. A 
savoir, soit 2 = (21, ..., zm), i—1,...,n, où les 2) sont des variables 


scalaires, de sorte que l’espace d variables z1, ..., z" est en réalité 
un espace de dimension mn; malgré cela, nous désignerons toujours l’espace des 
variables z!, ..., z" par En. Autrement dit, le symbole zt (pour tout i — 
= À, ..., n) désigne maintenant un point (de l’espace de dimension m) qui 
réunit m coordonnées du point dans l’espace ET de dimension mn. Pour cette 
interprétation des symboles 21, ..., z7 et E", le théorème 39.2 (de même que 
sa démonstration dans le n° 39) reste valable. C'est justement de ce fait que nous 
nous servirons pour démontrer le théorème 40.1. 


ne des variables auxiliaires x}, ui, où i= f, nn, Î—= 
= À, = 4, N, et désignons par z; le point qui nie toutes les 


54 


variables nee dont l'indice inférieur est égal à t: 
24 = (t}, is 27 u}, ss UE). 
L'espace des variables z,, ..., 2, (i. e. l’espace de toutes les variables x}, 
ui) sera noté EN, Nous écrirons également 
ri =(zt, ..., 27), us (ut, ..., uf), mas, ui): t=1, ..., N. 
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Soit maintenant Q l’ensemble de tous les points 
Z = (2, ..., Zn) = (Aus Uys Lo, Uos + + +, TN: UN) 
de l’espace EŸ qui satisfont aux relations 
PES PA CA PA PR à (41.1) 
us E Ut), t—14, ..., N, (41.2) 
Où xp = æ (0), fs (x, u), U; (x) sont les éléments qui participent à la définition 


de l’objet discret commandé (40.1), (40.2). Sur l’ensemble Q& EN définissons 
la fonction F (z) en posant : 


N 
F(z)=F (24, ..., 2N)—#F (xy, Uy, Go, Uo, ..., x, un) = >, 9 (ær-1, us), (41.3) 
t—=1 


où ff(x, u), t—=1,..., N sont les fonctions qui participent à la définition 
de la fonctionnelle (40.5). 

Soit (40.3), (40.4) un processus admissible quelconque pour l’objet discret 
commandé, i. e. supposons qu’il satisfait aux relations (40.1), (40.2). Définis- 


sons le point 3 = (z1, uy, To, Us, . . ., xn, un) de l’espace EN en posant 
m=t(t,uw=u(t,t=1,...,N. (41.4) 


Il découle de (40.1), (40.2) que le point z satisfait aux relations (41.1), (41.2) 
i. e. z€ Q. Réciproquement, chaque point z € Q détermine suivant les formu- 
. (41.4) un processus admissible pour l’objet discret commandé que l’on con- 
sidère. 

Ainsi, les processus admissibles sont en bijection avec les points de l’en- 
semble Q. La valeur de la fonctionnelle J pour le processus admissible (40.3), 
(40.4) est égale à la valeur de la fonction F au point correspondant z € Q, d’après 
(40.5) et (41.3). Par conséquent, les relations (41.4) réduisent le problème de 
commande optimale considéré au problème du minimum de la fonction F (2) 
définie sur l’ensemble Q. On peut alors appliquer le théorème 39.2 à ce dernier 
problème. 

Ainsi, nous avons la fonction F (z,, ..., zn) (voir (41.3)) définie sur l’en- 


semble RQ EN. Considérons les ensembles Q N-1 «+ Q, que l’on avait intro- 


duit dans le théorème 39.2 (page 357). Désignons par EN l’ensemble des va- 
riables z,, ..., 2nw.,; alors Q,,. est l’ensemble de tous les points (z,... 


RC) CE Ÿ pour chacun desquels on peut choisir un point zn tel que 
(z1 «  , 2x1 2x) € Q. D'après la définition de l’ensemble Q il est clair que 
le point (z, ..., zx) appartient à l'ensemble Q,,_, si et seulement si l’on 
a les relations (41.1) et (41.2) pour & = 1, ..., N — 1 (car on peut alors choisir 
un point quelconque uxy € Un (xxy_1), tandis que zy sera déterminé à partir de 
(41.1) en posant t1— N; nous obtiendrons ainsi un point z7 tel que 
(z15-.., 2x1, 2x) € Q). D'une manière analogue, le point (2, ..., z,) ap- 
partient à l’ensemble Q, si et seulement si l’on a les relations (41.1) et (41.2) 
pour £—=1,...,k. 

Construisons ensuite les fonctions © N-1 + «+, @. définies sur les ensembles 
Qx1, - .., ©, suivant les formules (39.2), (39.3), mais en désignant maintenant 
ces fonctions par @%_4, -.., @f (en conservant la notation @xy_1, . . ., @ 


pour les fonctions à construire qui vont satisfaire aux conditions du théorè- 
me 40.1). D'après (39.2), 


OÙ _ 4 (24, 23% ZN_1) = min F (24, y Z2N—-1) ZN) = 


ZN 
N N—1 
=min D fers, w)= D fO(crs, us) +-min 4 (ent, un) 
Zn t—=1 t= 1 ZN 


24% 
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Ici le point (z,, ..., zy_1) € Q, est supposé fixe et le minimum se calcule 
sur tous les z,, pour lesquels (z,, . .., zxy_1, 2x) € Q. Mais si (z,, . .., zx) € 
E Qwy-1, ie. on à les relations (41.1), (41.2) pour t = 1, ..., N — 1, alors 
pour que le point (z, ..., zxy_1, 2x) appartienne à l’ensemble Q, il faut et il 
suffit que le point zy — (xy, ux) Satistasse aux relations (41.1), (41.2) pour 
t— N,i.e. que l’on ait uy € Ur (xy1), le point zx étant déterminé à partir 
de (41.1) pour = N. Ayant noté que Îe point x}, ne figure pas dans l'expression 
ÎN (Zy-1: Un), nous pouvons donc conclure que le minimum se calcule pour 
tous les u,y € Uy (xxy1). Aïnsi, 
N—1 
D 4(Zts +. 2N1)= D, f(æi-4, wy)+ min NÜEN-1r UN). 
t— 1 Un EU x (X nr _1) 
Rappelons-nous que on (x) = 0 (voir page 361); nous obtenons donc 


min NN, Uun)= min [on (fn (xn-1), u)) + fQ(xn-1, u)]. 
UNEU N Gn_1) À UEU x (x _1) à 
Le deuxième membre est égal à w,,_, (xxy_1), conformément à (40.6). Ainsi, 
N-1 
OÙ (zu ..., 2N-1)= D) FY(tr4, wi) + ON-1 (xN 1), 
i—1 


où ww, est la fonction introduite avant la formulation du théorème 40.1. 
La fonction w%_, est donc calculée. Supposons déjà établie (pour un cer- 


tain &k—=2,..., N — 1) la formule 
R 
Of (24, zh) = >» F9 (ti-1 Us) + Ok (tr) - (41.5) 
t= 1 


Montrons que cette même formule reste valable lorsqu'on remplace k par k — 1. 
Nous avons (en omettant les détails qui sont analogues à ceux du raisonnement 
précédent), d’après les relations (39.3), (41.5), (41.1) et (40.6): 


OÙ _ 4 (Zto .., Zn-1) = MIN Of (24, ..., 21, 2h) = 
z 
k 


k 
= min [D (ces w)+o(x)]= 
2h Gps Up) = 1 
k—1 
= D frs up+ min (fe (cr-1, x) + On (cr) = 
1—1 XRr UR 
k—1 
= fo (xr-1 PR Ua h-15 Up) + Op (fr (Th-13 U))] = 
21 a 7 


— fé(tt-t + min [ff (xx, u) + 
t=1 UEUz (xp _1) 


Rk—1 
+ On (fr (era u))]= D) ff (mers wi) + on (œR-4). 
t=1 


Ainsi, la récurrence effectuée nous montre que la formule (41.5) est valable pour 
tous les k = 1, ..., N — 1. En particulier, 


Of (21) = F9 (to: U4) + © (x1) = F9 (to, ur) + @1 (F1! (ro, w4)). 
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Et, par conséquent, d’après (39.5) 


m=min@(z)= min [f(xo, w4)+@4 (fa (ro, w4))]. (41.6) 
21 U1EU 4(xo) 


Appliquant maintenant le théorème 39.2 et remplaçant dans les rela- 
tions (39.6) les fonctions F, w* et le nombre m par leurs expressions (41.3), 


(41.5), (41.6), nous obtenons l’assertion suivante. Le point z = (z, ..., zx) € 
€ Q est un point de minimum de la fonction F (z, . . ., zx) si et seulement si 
l’on a les relations: 


N N-1 
D (ces, wi) — D Pxras ui) On-1 (EN -1) = 
er) i=1 


N-2 
= D, fre w)+On-2 (zn-2) = ... = {9 (vo, u1) + O1 (1) = 
i=1 


— min [f9 (to, u41) +1 (f1 (xo, w4))]. 
u1EU 1(x0) 


Mais ces relations (si l’on prend en considération w,}, = 0) sont équaivalentes 
aux suivantes : 


FN (EN-1, UN) + ON (x) = ON-1 (&N 1), 
4 (EN-23 UN-1) + ON-1 (2 ù-1) = ON-2 (x N-0); 
15 (ts U2) + @2 (t2) — ©1 (x), 
fi (to, Us) +@14 (xs) min [ff (to, u1) + @1 (F1 (to, w))]. 
Uu1EU1 (xo) 


Si les deuxièmes membres de ces relations (sauf la dernière) sont récrits à l’aide 
des relations (40.6), on obtient 


fR(ceu uw) +o(x)= min [os (fi(zia, u)) + f$(xs1, u)], 
ET 063 
ER NP À PS 


ce qui, d’après (41.1), (41.4) coïncide avec les relations (40.7). Ce qui termine 
la démonstration du théorème 40.1. (Remarquons aussi que la validité du corol- 
laire 40.2 découle de (41.6) d’après la première assertion du théorème 39.2.) 

La démonstration ci-dessus est une bonne illustration de la relation pro- 
fonde existant entre le problème du minimum d’une fonction et le problème de 
la commande optimale d’un objet discret. Du point de vue formel, le théo- 
rème 40.1, comme nous l’avons vu, se déduit du théorème 39.2 et, dans ce sens, 
ne contient rien de nouveau, sauf la forme de son énoncé. Mais la démonstration 
même du théorème 40.1, comme corollaire du théorème 39.2, est suffisamment 
compliquée, elle n’est pas plus simple que la démonstration directe du théorè- 
me 40.1. D'autre part, il fut nécessaire de spécialiser le théorème 39.2 (pour en 


déduire le théorème 40.1), en considérant zl, ..., z comme des points, 
i.e. en regroupant les arguments de la fonction F: z = (x, wi), . .., 2ù — 
ho 

Tr (tar un). 


Il est donc clair que pour la résolution des problèmes de commande opti- 
male des objets discrets il est peu pratique d’effectuer à chaque fois 
une réduction du problème à celui du minimum d’une fonction (i. e. répéter les 
raisonnements exposés sous forme générale; pages 370-373); il est commode 
d’avoir un théorème séparé se rapportant spécialement au cas d’un objet com- 
mandé discret tel que le théorème 40.1. Il va de même des théorèmes ultérieurs. 
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. Uonditions necessaires d Optimalite 
$ 12. Conditions nécessaires d’optimalité 


Les méthodes de résolution des problèmes de commande opti- 
male des objets discrets exposés dans ce paragraphe sont des applica- 
tions immédiates des méthodes du n° 36; cependant, les résultats 
obtenus pourraient être démontrés indépendamment et non déduits 
des théorèmes du n° 36. 

à Les théorèmes que nous énoncerons ici ne sont pas aussi généraux 
que ceux de la méthode de programmation dynamique, parce qu'ils 
imposent certaines restrictions sur l’objet discret commandé (en par- 
ticulier, sur les fonctions ff (x, u) (voir page 361) que l’on doit sup- 
poser régulières). Mais cette classe d'objets discrets reste tout de 
même suffisamment large, tandis que les résultats obtenus sont plus 
profonds (i.e. ils contiennent plus d’information que le théorème 
40.1). Des conditions suffisantes d’optimalité seront données au 
$ 13. 

42. Le problème fondamental. Considérons tout d’abord le pro- 
blème fondamental (page 28). Autrement dit, nous allons 
considérer l’objet discret commandé (40.1) pour lequel la com- 
mande uw (t) est sujette aux restrictions (cf. (40.2)) 


HOREUR LT se, | (42.1) 
où U,, ..., UN sont des ensembles. L'état initial x (0) — x, est 
donné, tandis que les états x ({) pour { — 1, ..., N ne sont sujets 


à aucune restriction. Il s’agit de choisir pour l’objet (40.1) une com- 
mande (40.3) qui satisfait aux conditions (42.1) et donne à la fonc- 
tionnelle (40.5) sa valeur minimale (où (40.4) est la trajectoire issue 
de l’état x,] et correspondante à la commande choisie). On suppose 


en même temps que toutes les fonctions fi (x, u) (i = 0, 1, ...,n; 
t—1,..., N) sont continûment différentiables relativement à x, 
u (i.e. relativement à xt, ..., x", ul, ..., u” 


Des variables auxiliaires 4, et 1; ({) (et parfois d’autres) figurent 
dans les formulations de toutes les conditions d’optimalité ci-des- 
sous (comparer à l'énoncé du principe discret du maximum ; page 70). 
À l’aide de ces variables on définit une fonction auxiliaire H; (x, u) 
qui figurera également dans les formulations des conditions d'optima- 
lité. Ainsi, dans le premier théorème à considérer, la fonction 
H; (x, u) aura la forme suivante: 


Hi(e m=hf(e W+) WOfAGu. 422) 


Remarquons que dans le premier membre de (42.2) nous avons expli- 
citement noté que la fonction A}; ne dépend que de x, u (quoique dans 
la définition de cette fonction on rencontre également les variables 
#;). Cela s'explique par le fait qu’il faudra calculer les dérivées de 
cette fonction relativement à x, u (les variables 4, et 1; (é) étant 
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fixes). En particulier, les vecteurs 


gradx 1; (x, nr Lo. D), 
0H; (x, 0H} (x, 
grad Hi(z, u)= {160 ,..,, m0) 


sont définis. 

Théorème 42.1. Supposons donnée une certaine commande 
(40.3) et la trajectoire correspondante (40.4) (à état initial x (0)) pour 
l’objet discret commandé (40.1), (42.1). Supposons ensuite que L: est 
la coupole de l’ensemble U}, au point u (t), t = 1, ..., N. Pour l’op- 
timalité de ce processus (dans le sens du minimum de la fonctionnelle 
(40.5), l’état initial x (0) étant fixe et aucune restriction n'étant imposée 
sur les états x (t), t — 1, ..., N) il est nécessaire qu’il existe un nom- 
bre 1, et des vecteurs 


dt) be 0 me OS Les NV 


tels que l’on a les conditions suivantes (dans lesquelles figure la fonction 
H; (zx, u) définie par l'égalité (42.2)): 


(A) Y< 

(B) wp(N)=0; wpi)=grad; Hrn(x(t), u(t+1)), i=1, ... 
N—1; 

(C) pour tout t — 1, ., N et tout vecteur Ôu, dont la direction 


appartient au cône L:, on a , l'inégalité 
Ou grady, 3 (x (6 — 1), u ()) L0 


Démonstration. Désignons par E* l’espace des variables 


a, us i =, SNS Jet, 2 PS == , NV (ainsi, la 
dimension de cet espace est Vn “à Nr). Substituons à la place des 
arguments des fonctions fhi=0,1,...,n:t—1,...,N, qui 


caractérisent l’objet discret commandé en considération, les varia- 
î i. 
bles xi;_1, ui: 
à À n 1 Tr 
fi (xt us) = f{ (xt ,, ces Vi-1, Ut, ..., ut) 


(où pour { — 1 les symboles x}, . .., x? désignent les coordonnées 
de l’état initial x (0) — x, € ET). On peut maintenant supposer 
que ces fonctions sont définies (et possèdent des dérivées continues) 
dans tout l’espace £*. A l’aide de ces fonctions, définissons dans l’es- 
pace E* un nouveau système de fonctions: 


Fa) PF (x, u) = fi (to Us) + fe (tas Ua) + +. 
. HN (Tnw-u Un), (42.3) 
Fi(z) = Fi (x, u)= — ai + fi (xs, D EP 
(42.4) 
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Désignons ensuite par Q* l’ensemble de tous les points z € E* qui 
satisfont au système d'équations 


Fi(2=0; i=d,...,n; 1—1,...,N. (42.5) 


L'ensemble Q% est directement lié à l’objet discret commandé que 
nous considérons. À savoir, soit (40.3), (40.4) un certain processus 
(à état initial x (0) = x,) pour l’objet commandé (40.1). Posons 


ri = ai (1), Ds islam Jesus Ti rl; ss N. 
(42.6) 


Il découle alors de (40.1) que le point z aux coordonnées x;, u? 
définies par les formules (42.6) vérifie les relations (42.5) (voir (42.4)), 
i.e. appartient à l’ensemble Q*. La valeur de la fonctionnelle (40.5) 
pour le processus considéré est alors égale à la valeur de la fonction 
F9 (z) au point indiqué z (voir (42.3)). Réciproquement, si le point 
z — (x, uw) appartient à l’ensemble Q*, alors, en détermi- 
nant xt), u(t) suivant les formules (42.6), nous obtenons un 
processus (40.3), (40.4) à état initial x, qui satisfait aux relalions 
(40.1). 

Notons enfin Æ* l’ensemble de tous les points z — (x;, ui) de 
l’espace E* qui satisfont, pour tous les t — 1, ..., NV, aux relations 


U= (ur, ..., WW) EU, 


(aucune restriction n'étant imposée sur les variables x?). Il est alors 
clair qu’il résultera de la substitution (42.6) que le système d’inclu- 
sions (42.1) sera remplacé par une seule inclusion: z € E*Ÿ. Ainsi, 
au lieu de considérer les différents processus et les valeurs de la fonc- 
tionnelle (40.5) pour l’objet commandé (40.1), (42.1), on peut con- 
sidérer les divers points de l’ensemble Q* N Æ* et les valeurs de la 
fonction F° (z) dans ces points. Autrement dit, Le problème de com- 
mande optimale posé se réduit, grâce au changement de variables (42.6), 
au problème de la recherche du point z dans lequel la fonction F (2) 
restreinte à l’ensemble Q* AN E* atteint sa valeur minimale. 

Soit (40.3), (40.4) le processus optimal cherché. Le point corres- 
pondant de l’espace Æ£* (dont les coordonnées se déterminent par 
les formules (42.6)) sera désigné par z,. Alors, z, € Q* MN E*, et dans 
ce point la fonction FÆ° (2) restreinte à l’ensemble Q* N E* atteint 
sa valeur minimale. Désignons ensuite par L* le sous-ensemble de 


l’espace E* qui consiste en tous les points z — (x?, u) vérifiant Îles 
relations pour tous les t — 1, ..., N 


= (ut, ..., U)CL. 
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Il est aisé de voir que L* est un cône convexe de l’espace E* de 
sommet au point z, et que ce cône est la coupole de l’ensemble £* au 


point 2, ; d'autre part, la direction du vecteur 8z — {ôxt, ôu} appar- 
tient au cône L* si et seulement si pour tout % = 1, ..., N la direc- 
tion du vecteur Ôux — {ôut, ..., dur} appartient au cône L,.. 
Parmi ces assertions il ne faut démontrer que celle qui affirme que 
L* est la coupole de l’ensemble £* au point z,. Comme Z,, est la cou- 
pole de l’ensemble U, au point u, — u (rt) (voir (42.6)), il existe une. 
application ., définie dans un voisinage du sommet du cône L,., 
à valeurs dans l’espace des variables uË, . . ., u?, telle que l’on a les 
conditions 1), 2) de la définition 34.1. En posant 


bad M) = Gr DOS Fete sNs Tatin 


nous obtenons une application 1, définie dans le voisinage du som- 
met du cône L* à valeurs dans l’espace E*. On vérifie immédiate- 
ment que cette application 4 satisfait aux conditions 1), 2) de la 
définition 34.1 et, donc, L* est la coupole de l’ensemble E* au 
point Z. 

D'après le théorème 36.9 *), il existe des nombres 


VELO, ÿ£, = ji ous n;t—1, +... N, 


dont un au moins est non nul et la condition (B) indiquée au théorè- 
me 36.9 est satisfaite. Introduisons les notations: 
Wi()=vÉ, i=1,...,n;1t=1,...,N, 

et montrons que la condition (6) implique les conditions (B), (C) 
de l’énoncé du théorème 42.1. 

En effet, la relation (6) prend dans le cas considéré la forme sui- 
vante: 
N 


D (bo grads , F° (20) + à » tai (zo)) 826: + 


ei a—1 y=1 
+ L (ogradu, F° (6) + > 3 va gradu, Fr (G0)) Bu<O (42.7) 
T—= a=1 YV— 


pour tout vecteur {ôx;, ôur} — {ôx;, ôu.} dont la direction appar- 
ent au cône L*. 

La relation (42.7) doit en particulier être satisfaite lorsque tous 
les Ôu., sont nuls, tandis que les vecteurs ôx; prennent des valeurs. 
quelconques (puisque dans la définition ducône L* il n’y 


avait aucune restriction sur les variables x;). Le facteur de ôx; dans 


*) Remarquons qu'il n'y a ici qu'un seul cône L*, et, par conséquent, 
les conditions de non-séparation des cônes W,, ..., Nh dans le théorème 36.9: 
deviennent superflues; cf. théorème 36.11. 


378 CRITÈRES D’'OPTIMALITÉ DES PROCESSUS DISCRETS (CH. V 


(42.7) doit donc s’annuler: 


n _N 
Yo gradx, F° (Go) + 2 2 pY gradx, F% (2) = 0, 
= NN: 


En tenant compte de la forme des fonctions F° et F3 (voir (42.3), 
{42.4)), nous obtenons la condition (B) du théorème 42.1. 

Prenons maintenant tous les x; nuls; choisissons un nombre 
entier 0 (1 L6 LV) et supposons que tous les Êu, pour t 6 sont 
nuls, tandis que pour ôuw, nous prendrons toujours des vecteurs dont 
la direction appartient au cône L$. Le vecteur obtenu {ôx;, ôu:} 


a une direction qui appartient au cône L* et vérifie donc la relation 
(42.7) Ainsi, 


n N 
(bogradu, F° (Go) + 3 2, pr grade, Fy (20)) 8uo<0 


(pour tout vecteur uw, dont la direction appartient au cône Lo). 
Prenant en considération la forme des fonctions FÆ° et F} (voir (42.3), 
(42.4)), nous obtenons ici la condition (C) du théorème 42.1. 

I] nous reste à remarquer que 4, = 0 (et donc 14, << 0), car pour 
Ÿo = 0 nous aurions obtenu 4; (f) = ÿ{ — 0 pour tous les i, £ de la 
condition (B) déjà démontrée, ce qui contredit le choix des nombres 
Vo; VE. 

Remarque 42.2. Si l’on considère le problème du maximum 
(au lieu du minimum) de la fonctionnelle (40.5), le théorème reste 
le même, sauf qu'il faut changer le sens de l’inégalité #, < 0. Cette 
remarque Se rapporte aussi bien aux théorèmes ultérieurs. Notons 
qu’on peut remplacer la condition (A) dans le théorème 42.1 par 
l'égalité ÿ, — —1 (et dans le cas du problème du maximum, par 
l'égalité 1, — 1), car la formule (42.2) est homogène relativement 
à Yo: Vi (6), i.e. la multiplication de toutes ces grandeurs par le même 
facteur k > 0 ne change rien au théorème 42.1. Cependant, dans les 
théorèmes ultérieurs, nous rencontrerons l'inégalité 1, < 0 qui n’ex- 
clut pas le cas w, = 0. 

Remarque 42.8. On peut (sans changer les conditions (A) 
et (B)) donner la forme suivante à la condition (C) du théorème 42.1 : 

(C”) pour chaque t — 1, ..., N la direction du vecteur 


grad, H; (x ( 0 1), u (£)) 


appartient au cône dual D (L;). 

L’équivalence des conditions (C) et (C’) se déduit immédiatement 
de la définition du cône dual. Remarquons aussi que sous cette for- 
me (i.e. le remplacement de la condition (C) par (C’)) le théorème 
42.1 peut être déduit (de la même manière) du théorème 36.2 dans 
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lequel il faut alors poser g — 0, ! — N, et prendre pour Q,, ..: 
Q,, les ensembles déterminés respectivement dans Æ* par les 
relations us EU:, t = 1, , N. 

Remarque 42. 4. D’ après le théorème 34.2 l'hypothèse du 
théorème 42.1 relative aux cônes Z; (i.e. la condition affirmant 
que ZL; est la coupole de l’ensemble L/; au point u (t),£—1, ..., N) 
sera satisfaite si chacun des ensembles U; est convexe et si l’on 
choisit pour ZL; de cône d'appui de l’ensemble convexe U;, au 
point w(t), {t — 1, ..., N. Une remarque analogue se rapporte 
également aux autres théorèmes de ce paragraphe. 

Notons encore que si l’on pose Æ y+, (x, u) = 0, la condition 
(B) du théorème 42.1 s’écrit sous la forme 


Ÿ (6) = grads Hu (x (6), u(t+1)), 1=1, ..., N. 


Une condition analogue sera employée dans l’énoncé de (B) dans la 
suite. 

Le théorème 42.1 et sa démonstration peuvent servir de modèle 
d'application des théorèmes du n° 36 à la recherche des conditions 
d'optimalité nécessaires pour les objets discrets commandés. Nous 
énoncerons ci-dessous les théorèmes plus généraux (dans le cas du 
problème fondamental) que l’on peut obtenir de cette manière à partir 
des résultats du n° 36. Nous nous servirons pour cela de l’assertion 
auxiliaire suivante. 

Théorème 42.5. Supposons que l’espace vectoriel R se décom- 
pose en une somme directe de ses sous-espaces D,, D,, ..., D. Dési- 
gnons par DŸ (i = 1, ...,s) le sous-espace de l’espace R engendré 
par la réunion de tous les sous-espaces D,, . .., D, sauf D;. Ainsi, 


R=D; @ D et D; € D? pour ii (i, j—1,...,s). 
Soit ensuite, pour tout i — À, ..., s, un système de cônes convexes 
(i i 
C.. co (42.8) 


de notre espace (à sommet commun dans l'élément nul 0 € R), qui est 
formé d'un seul cône (i.e. r; — 1) ou bien ne possède pas dans D; la 


propriété de séparation. Désignons par LS où i—1,...,s; j — 
= 1,...,r;)! l'enveloppe convexe de l'ensemble CŸ UD*. Alors 
LS), i=1,..., 5; j—1,..., ri, (42.9) 


sera un système de cônes convexes à sommet commun O qui ne possède 
pas dans R la propriété de séparation. 

Démonstration. Supposons, au contraire, que le systè- 
me de cônes (42.9) possède dans R la propriété de séparation, i.e. 
il existe parmi les cônes (42.9) un cône que l’on peut séparer de l’in- 
tersection des autres. Sans restreindre la généralité, on peut suppo- 
ser (quitte à changer la numération des sous-espaces D, et des cônes 
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(42.8)), que le cône L® est séparable dans À de l'intersection des 
autres cônes (42.9). Ainsi, il existe dans À un tel hyperplan T pas- 
sant par 0, que LY & P, où P, est un des demi-espaces fermés 
déterminés par l’hyperplan V, tandis que l'intersection IT de tous les 
autres cônes (42.9) es contenue dans l’autre demi-espace P, déter- 
miné par l’hyperplan FT. 

Supposons d’abord que r;, > 1 et admettons que le plan D, n’est 
pas entièrement contenu dans l’hyperplan l. Alors L N D, est un 
hyperplan de l’espace D,, tandis que P, fN\ D, et P, N D, sont les 
demi-espaces fermés déterminés dans l’espace D, par cet hyperplan. 
Comme 


C'eL"ND:e Papi 
n oe (ALS)NnD, ne ND, ec P,ND, 
j=2 j—2 
(car LO D, pour i-1), l’hyperplan LA D, sépare dans 
l’espace D, le cône C® de l'intersection CN..." Cri i.e. 


le système de cônes (42.8) possède pour i — 1 la propriété de sépara- 
tion, mais cela contredit notre hypothèse. La contradiction obtenue 
montre que (pour r, > 1) l’hyperplan T doit contenir le plan D.. 

Mais si r, — 1, alors l'intersection II de tous les cônes (42.9), 
sauf L®, contient le plan D, (puisque peur i À nous avons L > 
> Df= D.) et, donc, D, & II & P,. On en déduit que dans ce cas 
on a également D, € T. 


Ainsi, D, &T. D'autre part, quel que soit à — 2, ..., s, nous 
avons D; E Die LUE P,et, donc, D; l'. Par conséquent, tous 
les plans D,, ..., D, sont contenus dans F, i.e. RE [', ce qui est 


impossible. Ainsi, le système de cônes (42.9) ne possède pas dans À 
la propriété de séparation. 

Théorème 42.6. Soit (40.3) une certaine commande et (40.4) 
la trajectoire “correspondante (à état initial x (0)) pour l’objet discret 
commandé (40.1), (42.1). Supposons, d'autre part, que pour chaque 
t—1,..., N l’ensemble U,; est de la forme 

on... N@PNNnMNnEPn... ne, 
où l'ensemble Q; se définit dans l’espace des variables u!, . .., u° par 
le système d'équations 


Gi, «rs 0)=0, jE1,. +, ki, (42.10) 
l'ensemble Qÿ se définit par le système d’inégalités 
COR RU) Et de (42.11) 


y) —(n,) . 
tandis que OC OT nd sua TE sont certains ensembles 


de l’espace des variables u!, ..., u’. Soit enfin K®) la coupole de 
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l'ensemble QŸ au point u (t); L® la coupole de l’ensemble 29) au 


point u (t). Nous supposerons que dans un voisinage du point u (t) toutes 


les fonctions Gi, j = À, ..., k;;: gi. i ET; (u (é)), sont régulières et 
que pour tout t — 1, ..., N le système de cônes convexes L® (h — 
— À, ..., nu) ne possède pas dans l’espace des variables u}, ..., u’ 


la propriété de séparation. 

Pour l'optimalité du processus (40.3), (40.4) (dans le sens du mini- 
mum de la fonctionnelle (40.5), l’état initial x (0) étant fixe et aucune 
restriction sur les états x (t), t — 1, ..., N n'étant imposée) il est 
nécessaire ‘il existe un tel nombre y < 0 et de tels vecteurs 


pt)={h(), ..., Oh i=1,...,N; 

po) {qu(), .…., qu} t=1,..., N; 

À () = {M (6), ….) Aa, ()}; AE airs N ;: 
00, 1h teen 


que la direction du vecteur a% appartient au cône dual D (Kÿ) et 
l’on a les conditions suivantes (A)-(E) dans la formulation desquelles 
figure la fonction H; (x, u) définie par l'égalité 


He(e, 0) =oft(e, 2) + 2 be () fie, u)+ 
# 


+ 2 Ps (£) Gé (u) + À À (£) 85 (u) : 


(A) si = 0, de pour au moins une valeur de t, au moins un des 
vecteurs 4) (t), p (#), À (t), aŸ est non nul; 
(B) 4 () = grads Hs: (2 @), u(t+1)), 1=1,...,N, où 


l’on convient que Hy11 = 0; 


(C) pour tout t = 1, , N et tout vecteur Ôu dont la direction 
appartient à inter cion de cônes LŸ(j = 1,..., mi) on a l'iné- 
galité 

lg 


(grad, H}; (x (i— 1), u (£)) — 2 af) ou<0; 


(D) À; @) SO pour tout j — 1, ..., gs; t—1,..., N: 

(E) À; (à gi j (u (1) = O pour tout Rss el eee AN 

Démonstration. Comme pour é démonstration du théo- 
rème 42.1, considérons l’espace £* des variables x, ui et les fonctions 


(42.3), (42. 4) définies sur cet espace. Définissons 1e ‘ensembles Q* et 
E* de la même manière que dans la démonstration du théorème 42.1. 
Ainsi, si (40.3), (40.4) est Le processus optimal cherché et z, le point 
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correspondant de l’espace E* (les coordonnées du point se déter- 

minant par les formules (42.6)), alors la fonction F° (2), restreinte 

à l’ensemble Q* N E*, atteint au point z, Sa valeur minimale. 
L'ensemble Q* N E* peut s’écrire sous la forme 


Q ne* = 0 p 00 1 (1 6) n (N EP), 


it jt 
où Q° est déterminé par le système d'équations (42.5) et d'équations 
(voir (42.10)) 


Gi(u)=0, j—1,..., hi t=d,..., N: (42.12) 
d'autre part, Q0 se définit par le système d’inégalités (voir (42.11)} 
gi (ur) 0, i= 1, SR t—=1, ds N. 


Enfin, les ensembles Q$ et E9 (i — 14, ..., L:j—1,..., mu; 
t—1,..., N) se etiniscont respectivement par les inclusions 


(i (3) 
us: CO), u, CES. 


Désignons par À, LŸ les ensembles définis respectivement dans 
E* par les inclusions 
U, cKf U, CL, 


Alors, À est la coupole de l’ensemble G® au point z (i = 1, 


slt = LT se Net LS est la coupole de l’ensemble £ 20 au 
pointe 0e La soma" , N). 
On voit alors que le système de ‘cônes convexes 
LS, j=1, ..., nus: t—1,...,N, (42.13) 


ne possède pas dans £* la propriété de séparation. En effet, SUppo- 
sons que Z, est le point origine de l’espace E* (de sorte qe celui-ci 
devient un espace vectoriel), et désignons par D,, D,, ..., DX les 
sous-espaces de l’espace E* définis par les conditions: 


D,:u; = ut(t) pour tout t—=1,..., N; 


D,:x; = x(t) pour tout t = 1, , Net u; = ut(t) pour tout 
AT. Alors, E* se décompose en somme directe de sous-espaces 
D,, D,,..., Dn. En outre, désignons par D, D, ..., DK les 


SOUS- espaces tels que 
D; & Di —=E*, pe 1,...,N,et D, € D pour iÆ }j, 
np 0, , N. 
La relation uw; € L9 détermine dans : sous-espace D; un certain 
cône convexe LŸ de sommet z9 (j = 1, ..., ms), tandis que Le 
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est l'enveloppe convexe de l’ensemble LU DY (j = 1,..., mm; 


t—1,..., N). Posant maintenant LL, — z, et L, — D, nous 
voyons d’après le théorème 42.5 que le système de cônes convexes 


Lo, L9, j—=1,..., my; t—1,..., N, 


ne possède pas dans Æ* la propriété de séparation. A fortiori le sys- 
tème de cônes (42.13) ne possède pas cette propriété. 

Il est clair maintenant que l’on peut appliquer le théorème 36.8 
(dans lequel r — p — 0, le rôle des ensembles Q° et Q” étant joué 
par 9° et ©00), Désignons par Î4; (20) l’ensemble de tous les nombres 
i = 1, ..., g, pour lesquels gf (u;) — 0. Alors, d’après le théorè- 


me 36.8. il existe de tels nombres 
Vos VE Ph, i=1À,...,n,; j—=1,..., k,: 
t=—1,..., N 
(les nombres 4! correspondant aux égalités (42.5) et les nombres p 
aux égalités (42.12)) et de tels vecteurs af (i — 1, ..., l;; t — 
— 1,..., N) dont les directions appartiennent respectivement aux 


cônes duaux D (KŸ)), et enfin, de tels nombres non positifs né (j € 
E ZI} (2), t = 1, ..., N) que les conditions (0): (B), (y) du théo- 


rème 36.8 sont remplies. Posons aussi À — 0 pour j & T4 (&), 


de sorte ne les nombres non positifs hi seront définis pour tous les 
SE PS TR PR le tandis que pour toutes ces valeurs 


j,tona à les relations 
Afgi (+) = 0. (42.14) 
Remarquons maintenant que la condition (B) du théorème 36.8 
dans le cas considéré s'écrit sous la forme: 
N 


n ON 
2, Cogradk, F°(c)+ 2 21 Vagrads,Fy (50)) da: + 


N n NN 
2 (po gradu. F° (20) F2 2 42 gradu. F% (20)) Otx + 


ke A 
La : ( > (14 gradu, Gr (Zo) + à he gradu, 87 (20)) OU — 
ee = | 
l 


: N 
2 2 af5z<0  (42.15} 


pour tout vecteur Ô? — {ôx;, Ôu.} dont la direction appartient 
à l'intersection des cônes LP one ES Lo ere AN): 

La relation (42.15), en particulier, doit être satisfaite si l’on sup- 
pose nuls tous les ôu, et l’on donne aux vecteurs ôx; des valeurs 


quelconques (puisque LP = Df = D,). On peut en déduire, comme 
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dans la démonstration du théorème 42.1, la condition (B) du théoré- 
me 42.6. (La condition (A) découle directement de la condition (y) 
du théorème 36.8.) Notons que d’après les relations £$”= D,, 
K®9 = D, pourri tie. K° = D) le vecteur a peut être con- 
sidéré comme un vecteur dont la direction appartient au cône 
V GE) et aÿ6z — aSu,: dans le cas considéré aŸ6z — 0 car 
OU, — 

Supposons maintenant que tous les ôx, sont nuls; en outre, choi- 
sissons un entier positif 0 ( < 6 < N) et supposons que tous Îles 
ôu. sont également nuls pour t 6, et, enfin, pour ôuw, choisissons 
des vecteurs quelconques dont les directions appartiennent à l’inter- 


section des cônes Z£) , .... LS Le vecteur 2: — {ôx;, ôux)} 
obtenu a une direction qui appartient à l'intersection de tous 
les cônes L® (j —1,..., m;t—1,..., N) et donc il satisfait 


à la relation (42.15). Aïnsi, 


n  _N 
(bo gradu, F° (20) + à 2 pY gradu, Fy (20)) 80 + 


kg % fe 
0 . 
+ ( > qe gradu, G8 (20) + 2 ke gradu, 82 (20) ) Oo — 2 aôue LO 
a— œ—= i= 
pour tout vecteur êw, dont la direction appartient à l'intersection 
des cônes LS , ..., AA En tenant compte de la forme des fonc- 


tions Æ° et F4 (voir (42.3), (42.4)), nous en déduisons la condition 
(C) indiquée dans l’énoncé du théorème 42.6. 
Enfin, la condition (D) est satisfaite, puisque tous les nombres 


Af ont été choisis non négatifs et la condition (E) découle de (42.14). 
Remarque 42.7. Désignons par If” l’hyperplan tangent 
(dans l’espace des variables ut, . .., u”) à l'hypersurface Css 
..., #7) = 0 au point w () et par P% le demi-espace défini par l’iné- 
galité 
(u—u(t)) grad gi (u (4) 0, jET:(u()). 


Si pour chaque t — 1, ..., N le système de cônes convexes 
KO G=1, ..…., L), LP G=1, ..., mi), 
D G—1,...,k), PP (GET, (u(6))) (42.16) 
ne possède pas dans l'espace des variables u*, ..., u" la propriété 


de séparation, alors la condition (A) du théorème 42.6 peut être rempla- 
cée par l'inégalité %o << 0. 

En effet, supposons que ÿ, — 0. Alors la condition (B) du théo- 
rème 42.6 implique que H(f) —0,6—1,..., N. Par conséquent, 
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d’après la condition (A) de ce même théorème, pour au moins une 
valeur de {, au moins un des vecteurs ® (é), À (#6), a®? est non nul. 
Choisissons un tel {. La condition (C) du théorème 42.6 signifie que la 


direction du vecteur 


ly 
grady H4(x (é—1), u(t))— >» af 
t—1 


: _ (m,) ; 
appartient au cône D DAS D TE 1 L 4) et, par conséquent (vu 


le corollaire 31.4 et le lemme 32.1), ce vecteur est égal à Bb + . . . 

.e. + po" où la direction du vecteur b® appartient au cône 

D (Lÿ)). Ainsi, en tenant compte de 44 — 0, 1 (té) — 0, on obtient 
k, Qt 


— 2, 1 () grad Gi (u (9) — 2 A (6) grad gi (u (A) + 


l, my 
. (i 
d: 2 He + 2 Us ne 


Comme, d’après le choix du nombre #, des vecteurs non nuls figurent 
dans le premier membre de cette égalité, on peut conclure, vu le théo- 
rème 32.2, que le système de cônes (42.16) possède la propriété de 
séparation. La contradiction obtenue démontre donc que Yo Æ 0. 
Remarquons aussi que si, pour au moins une valeur de #, le systè- 
me de cônes (42.16) possède la propriété de séparation, alors l’asser- 
tion du théorème 42.6 perd sa signification (voir remarque 36.6). 
Dans l’énoncé du théorème 42.6 les nombres /,, m;, k;, qg; peuvent 
être des entiers non négatifs quelconques. En supposant que certains 
d’entre eux sont nuls, on peut obtenir toute une série de cas parti- 
culiers. Par exemple, le théorème 42.1 se déduit du théorème 42.6 
en posant l; = k; — q; — 0, m; = 1 (pour tout &é — 1, ..., N). 
D'autre part, on peut supposer, dans l’énoncé du théorème 42.6, 
que pour chaque & — 1, ..., N certains des ensembles 5 sont des 
hypersurfaces (dans l’espace des variables uf, ..., u”), certains se 
déterminent par des inégalités de la forme f9 (u) L 0 et d’autres 
sont des ensembles quelconques ayant LŸ? pour coupole. Ceci per- 
met de varier encore plus les divers corollaires du théorème 42.6. 
Parmi tous les corollaires que l’on peut ainsi obtenir, nous choi- 
sirons deux théorèmes, dont le premier s'obtient en posant /; — 
— m; — 0 (pour tout ét), et le second en posant l; = k; — q+ = 0 
avec la convention supplémentaire qu’une partie des ensembles Ef 
est formée d’hypersurfaces, tandis que les autres se définissent par 
des inégalités de la forme AŸ (u) < 0. 
Théorème 42.8. Soit (40.3) une certaine commande, et (40.4) 
la trajectoire correspondante (à état initial x (0)) pour l’objet discret 


25—01208 
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commandé (40. 1), (42.1). Supposons, en outre, que pour chaque L = 
— 4, ..., N l’ensemble U, est de la forme U, — Q;f G, où l’ensem- 
ble Q; se > définit dans l’espace des variables u!, . . ., u” par le système 
d' équations (42.10), tandis que l’ensemble Q} se détermine par le systè- 


me d'inégalités (42.11). Supposons ensuite que dans un voisinage du 
point u (t) toutes les fonctions G, j = 1, hi: ie, (u (t)), 
sont régulières. 

Pour l’optimalité du processus (40.3), (40.4) (dans le sens du mini- 
mum de la fonctionnelle (40.5) pour un état initial fixe x (0) sans restric- 
tions sur les états x (t), t — 1, . .., N) il est nécessaire qu'il existe 
un nombre Ÿn < 0 et des vecteurs 


{pi (8, MO 11, ..., N; 
pO= {qi (®, .…, qu, O} t=1, .., N; 
A (E)= {A (6), -.., Aa (0h =, .., NN, 


tels que l’on a les conditions suivantes (A)-(E), dans lesquelles figure læ 
fonction H}; (x, u) définie par l'égalité 


H;(x, u)=Yofi (x, u)+ 2 W: ()fi(x, u)+ 
“ | da 
1 2 où () Ge (u)+ 2h (é) gi (u) : 


(A) si Vo = 0, alors, pour au moins une valeur de t, au moins un 
des vecteurs 4 (t), @ (£), À (é) est non nul; 

(B) 4 (té) = grad, Hit (x (t},u(t+1)),4=1,...,N, où l’on 
a convenu que H x+1 = 

(C) grade H,(œ(t—1), u (4)) = 0, = 1,..::, N; 

(D) À; (4) <L 0 pour tout j = 1, ..., qu; t—1,..., N; 

(E) le (&) gi (u (t)) = 0 pour tout j — 1, ..., gsst = 1, ..., N. 

Théorème 42.9. Soit (40.3) une certaine commande et (40.4) 
la trajectoire correspondante (à état initial x (0)) pour l’objet discret 
commandé as 4), (42.1). Supposons, en outre, que pour chaque ARS 
— 1,..., N l’ensemble U, est de la forme U, = E; NE E; où l'en- 
semble & Et se définit dans l’espace des variables u}, . .., u’ par le systè- 
me d'équations | 


Diqut, ..., w)=0, j=1,..., 54, 
tandis que l’ensemble EH se détermine par le système d'inégalités 


hitut, ..., u)<&O0, i=1,..., pa. 


$ 12] CONDITIONS NÉCESSAIRES D’OPTIMALITÉ 387 


Désignons par TI; (u (t)) l'ensemble de tous les nombres i — 1, ..., ps 
pour lesquels hi (u (t)) — 0. Nous supposerons que tous les vecteurs 
grad Di(u (t)), j=1,..., s:; 

grad hitu(t)), iETs(u(t}), é=1,..., N 

sont non nuls. Désignons par 1° l'hyperplan tangent à l’'hypersurface 

Di (u) = 0 au point u(t) G —1, ..., 4, t —1, ..., N) et par 

P; le demi-espace défini par l'inégalité 

(u — u (t)) grad nm (u G))<LO0, Elu), 1=1,..., N, 


et supposons que pour chaque t = 1, ..., N le système de cônes con- 
vexes 


, 


Li, Ph, j=1,...,83; 1€ (u(r), (42.16) 


ne possède pas la propriété de séparation dans l’espace des variables 
D ss 

Pour l'optimalité du processus (40.3), (40.4) (dans le sens du mini- 
mum de la fonctionnelle (40.5) à état initial fixe x (0), sans restrictions 
sur les états x (t), t — 1, ..., N), il est nécessaire qu'il existe un tel 
nombre 1, et de tels vecteurs 


4 (2) = 1 G), +. a G)}, 2=1,..., N, 


que l’on a les conditions suivantes (A)-(C) dans lesquelles figure la fonc- 
tion H;, (x, u) définie par l'égalité (42.2): 

(A) Ÿo < 0; 

(B) #(@) = gradHin (GG), uG+1)), 1=1,...,N, où 
l'on convient que H x+, = 0; 

(C) pour tout vecteur du dont la direction appartient à l'intersection 
des cônes (42.16), on a l'inégalité 


du grad,H; (x (t—1), u(t))<O0, t—=1,..., N. 


(L'inég alité 14 << 0 se démontre ici exactement comme dans le 
théorème 42.1.) 

43. Problème à restrictions de phase. A présent nous considérons 
le problème de commande optimale d’un objet discret à domaine de 
commande constant, soumis à des restrictions de phase. Autrement 
dit, nous allons étudier l’objet commandé (40.1), (42.1) dont les états 
de phase sont sujets aux restrictions 


x (t)E M}, "0; 1, si 3 N. 


Pour cet objet, posons le problème de la recherche du processus 
(40.3), (40.4) satisfaisant aux restrictions imposées et donnant le 

minimum de la fonctionnelle (40.5). 
Considérons tout d’abord le cas où chacun des ensembles ,, 
t— 0, 1, ..., N, se représente sous la forme M, = Il; A ©, où Il; 
20% 
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est l’ensemble défini dans £” par le système de relations 
Wi(x) = Wi(x!, ..., 2)=0, i=1,...,r4, (43.1) 


et >», est un certain ensemble de l’espace £” (nous supposerons par 
la suite que nous connaissons la coupole de cet ensemble au point 
x (t)). Exactement de la même manière, nous supposerons que cha- 
cun des ensembles U,, T — 1, ..., NV, se représente sous la forme 
U, = Q:fN &., où Q: est l’ensemble déterminé dans l’espace des 
variables ul, ..., u" par le système de relations 


Giçut, ..., w)=0, j—=1,..., ke, (43.2) 


tandis que #, est un certain ensemble du même espace (et nous sup- 
poserons que nous connaissons la coupole de l’ensemble £, au point 
u (t)). Les fonctions W; et G sont supposées régulières. Dans ces 
conditions, on a le théorème suivant. 

Théorème 43.1. Soit (40.3) une certaine commande et (40.4) 
la trajectoire correspondante (à état initial x (0) € M,) pour l’objet 
commandé (40.1), (42.1), Les inclusions x (t) € M;,, t —1,...,N, 
étant satisfaites. Supposons, en outre, que l'ensemble M, se représente 


sous la forme M; = Il; N Z;, é—0, 1, , N, où l’ensemble Il; se 
détermine dans l’espace E" par le système de relations (43.1), tandis que 
l'ensemble U,,T = 1, N, se représente sous la forme U., = Q;f 


N &., où l'ensemble Q! est déterminé dans l’espace des variables 

, u” par le système de relations (43.2). S D enfin que L. est 
la coupole de l’ensemble Æ, au point u (t), t = 1, N tandis que 
Q; est la coupole de l’ensemble 2, au point x (t), = O, A , NV. 

Pour l’optimalité du processus considéré (dans le sens ‘du minimum 
de la fonctionnelle (40. o), avec les restrictions x (t) € M;, t = 0, 1, 

., N), il est nécessaire qu'il existe un tel nombre 1, < 0 et de tels 
vecteurs 


DE) = {p1(#), ..., Ya (t)}, 11,4, NS 
DE) {p1(t), -.., pr, ()}, ES PR 
pu (8) = {hu (#), +, Ur, (0)}, b=0, 135 N2 


que l’on a les conditions suivantes (A)-(C), dans lesquelles figure la fonc- 
tion H}; (x, u), définie par l'égalité 


n | k, 
He(e, u)=Voft(e, 2) + 2 db (9 f(x, u)+ 2 qu (f) GE (u): 


(A) si ÿ, —= 0, alors, pour au moins une valeur de t, au moins un 
des vecteurs 1 (t), œ (t), u (é) est non nul; 
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(B) pour chaque t = 0, 1, ..., N et chaque vecteur x dont la di- 
rection appartient au cône Q;, on a l'inégalité 


(— (6) + grads His (x (8), w (8 + 1)) + 
“ 


+ à Ua (t) grad WY (x ()) Ôx 0 


à l'on a convenu que % (0) = 0 et Hy4, = 0; 

(C) pour tout t = 1, ..., N et tout vecteur Ôu dont la direction 

appartient au cône L;, on a l'inégalité 
du grad,H; (x (t—1), u(t)) O0 

La démonstration de ce théorème suit la même voie 
que celle du théorème 42.1. Désignons par E* l’espace des variables 
DE 0 A PR 0 — 
—= 1; N. Ainsi, contrairement à la démonstration du théorème 


42. 1, Les grandeurs di i — 1, ..., n, sont ici également supposées 
variables. Les fonctions (42. 2) définies sur l’espace E* sont continues 


et continûment différentiables. Les fonctions F° et Fi (voir (42.3), 
(42.4)) sont également définies et continûment différentiables dans 
l’espace E*. Ajoutons encore à (42.3), (42.4) les fonctions suivantes: 


Ai(z)= Aix, u)=Wi(xi, ..., x?); 
i—1,..., 3: t—0,1,...,N, 

Di(z)—Di(x, u)—Gi(ul, ..., u?): 
11 ..., Ex ; "1: .. N, 


où Wi et G sont les fonctions qui figurent dans la définition des 
ensembles M}; et U, (voir (43.1), (43.2)). Désignons par G* l’ensem- 


ble de tous les points z — (x, ui) de l’espace E* qui satisfont au 
système d'équations 
Fi(z) =0 ; Less met sis 
Aï(z) =0 ; bel sun M OS sai 
D£(z) = 0; j=1, ..., k5 T1, ..., N. 
Ensuite, par E* nous désignerons l’ensemble de tous les points 
z — (x;, u?) de l’espace E* qui vérifient les conditions 
Dress Die Ds dei TT ss UNS 
(ur: ….. ur) € Bu, T1: ss N. 
De même que pour la démonstration du théorème 42.1, la subs- 
titution (42.6) (dans laquelle { varie maintenant de 0 à N) réduit le 


390 CRITÈRES D’OPTIMALITÉ DES PROCESSUS DISCRETS (CH. V 


problème de commande optimale 
lequel la fonction F° (z) restreinte 
valeur minimale. 

Supposons que (40.3), (40.4) est le processus optimal cherché. 
Désignons par z, le point correspondant de l’espace E* ; ses coordon- 
nées étant définies par les formules (42.6). Alors z, € Q% M E* 
et la fonction F° (2), restreinte à l’ensemble Q* AN E*, atteint en 
ce point sa valeur minimale. Désignons ensuite par ZL* le sous-en- 
semble de l’espace £* qui est formé de tous les points z — (x;, ui) 
satisfaisant aux relations 


la recherche du point z dans 


à 
à l’ensemble Q%Y AN E* atteint sa 


Zy = (xt, ess xt) CE Où, t—0, À, ss és N ; 
= es M)EDe ed, so N. 


Il est clair que L* est un cône convexe de l’espace E* de sommet au 
point z, et que ce cône est la coupole de l’ensemble E* au point z 
(comparer au raisonnement correspondant dans la démonstration du 
théorème 42.1). Il est également évident que la direction du vecteur 
2 — {Ô0x;, du.) appartient au cône L* si et seulement si pour cha- 
que £ — 0, 1,..., N la direction du vecteur ôx, appartient au 
cône Q;, et, en outre, pour chaque t = 1, ..., NV la direction du 
vecteur Ôu, appartient au cône Z.. 
D’après le théorème 36.9, il existe des nombres 


bi O, di il, nm, 11, NN; 
Hs M es Th = 0 T5 1, 
(OHE Ï= 1, “ts k:: T=i, e...:3 N, 


tels qu’au moins un d’entre eux est non nul, et l’on a la condition 
(B) du théorème 36.9 qui dans le cas donné prend la forme 


N n  _N 
2, Cbograde, F° (2) + 25 2 Va grade, Fy (au) ) ai + 


N n  _N 
+ 2 (hogradu, F°()+ 2 2 Ve grade, F3 (60) Sur + 


N ‘" 
2e 2 2 ui (Ôx: grad, Af (20)) + 


ke 


N 
2 pa pi (Ou: gradu_ Dr (2)) SO. (43.3) 


Cette relation doit être satisfaite pour chaque vecteur 82 — {ôx:, 
ôu.} dont la direction appartient au cône L*. 
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Posons tous les Êw. égaux à 0; en outre, choisissons un certain 
nombre entier 0 (0 < 6 < N), posons tous les ôx; pour £ = 0 égaux 
à 0, et pour x, choisissons tous les vecteurs dont les directions appar- 
tiennent au cône O9. Le vecteur ainsi obtenu ô2— {ôx;, Ôu.} est 
de direction appartenant au cône L*, et par conséquent, il satisfait 
à la relation (43.8). Ainsi, 


n  N 
(bo grad,, F° (20) + à 2 4 gradx, Fy (20) + 
ra 
+ 2 né grad, A8 (20)) te LO 
= 
pour chaque 8 — 0, 1, ..., N et chaque vecteur ôxs dont la direc- 


tion appartient au cône Q,. En tenant compte de la forme des fonc- 
tions F° et F%(voir (42.3), (42.4)), récrivons cette condition : 


{Vo grad,,f0+1 (te, 041) — 1° + 21 port grad,, f6+1 (To; Uo+1) + 


Tr 

6 
ns 2 u® grad,, W6 (to)) 8x6 <0, 

= 
qui est valable pour tout 6 — 0, 1, ..., N et tout vecteur 8x, dont 
la direction appartient au cône Q4. Ici nous avons désigné par 1° 


le vecteur {bf, . .., #9} et nous supposons que 4 — 0 et frs = 
=0 (G—0,1,...,n). 

Si nous appliquons maintenant la substitution (42.6) dans laquel- 
le & varie de 0 à NV et posons 1, (#) — dE, ui (6) = uë, p; (6) — pi, 
alors il découle directement de ces relations la condition (B) indiquée 
dans l’énoncé du théorème 43.1. 

Posons maintenant tous les ôx, égaux à 0; en outre, choisissons 
un certain entier 0 (1< 0 < N) et posons tous les ôu, pour T Æ 6 
également égaux à 0 ; pour Ôw, nous choisirons des vecteurs quelcon- 
ques dont la direction appartient au cône L,4. Le vecteur ainsi obtenu 
Ô: = {ôx;, du.} est de direction appartenant au cône L* et satisfait 
donc à la relation (48.38). Ainsi, 


n N 
{bo gradu, #° (20) + 21 À, pr gradu, F5 (20) + 
kg 
+ 2 qe gradu, D6 (20)) 80 <O 
œ=—= 
pour tout 0 — 1, ..., N et tout vecteur ôus dont la direction appar- 


tient au cône Lg. En tenant compte de la forme des fonctions FÆ° et 
#9 (voir (42.3), (42.4)) et appliquant la substitution (42.6), dans 
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laquelle # varie de 0 à N, nous pouvons déduire immédiatement de cette 
relation la condition (C) indiquée dans l’énoncé du théorème 43.1. 

Remarque 43.2. II va de soi qu’il peut arriver, dans le théo- 
rème 43.1, que pour un certain é — 0, 1, ..., N (ou même pour 
tous les t) les relations (43.1) sont absentes, i.e. IT; coïncide avec l’es- 
pace Æ” tout entier et donc M, = Il; A >; — EN À, = >, (dans 
ce cas Q; est la coupole de l’ensemble 7, lui-même au point x (#)). 
Dans ces conditions, le vecteur correspondant nu (é) sera absent 
dans l’énoncé du théorème 43.1, i.e. dans les conditions (A) et (B) 
du théorème 43.1 on peut simplement supprimer tous les termes qui 


contiennent pu; (£), i = À, ..., ri. 

D'une manière analogue, si pour un certain tT = 1, ..., N 
(ou pour tous les v) les relations (43.2) disparaissent, i.e. Q; coïncide 
avec tout l’espace des variables u!, ..., u" et donc U, — E, 


(de sorte que Z, est la coupole de l’ensemble U, lui-même au point 
u (t)), alors le vecteur œ (t) sera absent dans l'énoncé du théorè- 
me 43.1, et donc dans la condition (A) du théorème 43.1, ainsi 
que dans l’expression de la fonction W; (x, u), on peut simplement 
éliminer tous les termes qui contiennent ®; Hhi=T 

En particulier, si les relations (43.1), ainsi que les relations (43. 2. 
sont absentes, et l’ensemble A, est composé du point unique x (0) 
et les autres ensembles M;, t — 1, ..., N coïncident avec tout 
l’espace Æ£" (de sorte que Q; — E", t — 1, ..., N), alors le théo- 
rème 43.1 se transforme dans le théorème 42.1. 

Remarque 43.3. Supposons que les relations (43.1) sont 
indépendantes au point x (f) (pour tout £ — 0, 1, ..., N), i.e. sup- 
posons que Il; est une variété dans un voisinage du point x (t). 
Désignons par IIf le plan tangent à cette variété au point x (1). 
Supposons, en outre, que les cônes If et Q; (de sommet commun 
x (t)) sont inséparables dans Æ7, i.e. il n'existe pas l’hyperplan l' 
tel que II1# € F, tout le cône Q; étant situé dans un demi-espace 
fermé déterminé par l’hyperplan T. 

Supposons de la même manière que les relations (43.2) sont indé- 
pendantes au point w (tr) (pour chaque t = 1, ..., N), i.e. que 
Q: est une variété dans un voisinage du point u (x). Désignons le 
plan tangent à à cette variété au point w (t) par Q?. Supposons enfin 
que les cônes Of et L, (à sommet commun w (x) sont inséparables 
dans l’espace des variables DT 

Dans ces hypothèses la condition (A) du théorème 43.1 peut être 
remplacée par la condition suivante : 

(A”) si Yo — 0, alors pour au moins une valeur de t, le vecteur 
4 (£) est non nul. 

En effet, supposons que l’on a choisi un nombre 1, et des vec- 
teurs 4 (£), @ (6), u (é) qui satisfont aux conditions (A), (B) et (C) 
du théorème 43.1 et supposons que l’on a 4, —= 0, tous les vecteurs 
4 (#) étant nuls. Alors, d’après la condition (A), au moins un des 
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vecteurs œ ({), u (?), pour au moins une valeur de #, est non nul. 
supposons pour préciser que pour un certain £ (= 0, 1, ..., N} 
le vecteur a ({) — {lu (), - -., pr, (#)} est non nul (dans le cas 
où un des vecteurs @ ({) est non nul, les raisonnements sont analo- 
gues). Alors, d’après la condition (B), nous obtenons 


ôx où La (6) grad WŸ (x (t))) 0 (43.4) 


pour tout vecteur êx dont la direction appartient au cône Q;. Comme 
le vecteur pu (£) — {ua (#), - .., pe, (#)} est non nul et les relations 
(43.1) sont indépendantes au point x (£), ïi.e. les vecteurs 
grad W®(x (t)), &« = 1, ...,r;, sont linéairement indépendants, 
le vecteur 

de 

n — 2 Lo (t) grad WY (x (t)) 

œ—= 
sera non nul. 

Désignons par [' l’hyperplan de l’espace EE”, orthogonal au 
vecteur n et passant par le point x (4). Il découle de l’expression du 
vecteur n qu'il est othogonal au plan II* et, donc, IIf & l'. En 
outre, on déduit de (43.4) que nôx <0 pour tout vecteur ôx dont 
la direction appartient au cône Q;. Par conséquent, le cône Q; est 
entièrement contenu dans un demi-espace fermé déterminé par 
l'hyperplan l, et donc l’hyperplan [ sépare les cônes Ilf et Q; 
ce qui contredit l’hypothèse. La contradiction obtenue nous montre 
que la condition (A’) est remplie. 

Théorème 43.4. Supposons que dans les hypothèses du théo- 
rème 43.1 l’ensemble ZX; est déterminé dans l’espace E" par les iné- 
galités 


ui (x) = wi (xl, ..., 2)&KO; j=1,..., ps, (43.5) 
où les w} sont des fonctions régulières, le système de restrictions (43.5) 
étant non dégénéré au point x(t), où t — 0, 1, ..., N. Alors, la 


condition (B) (du théorème 43.1) peut être remplacée par la condition 


suivante : 
(B”) il existe de lels vecteurs v (t) — {vi (6), . . ., Vp, @)}, t — 
= 0, 1,..., N que l’on a les relations 


Vi (DL, vi(t)uwi(r(t))=0; j=1,..., p3t=0,1,...; N; 
É: 
(= grade His (e (6), (6410) + 25 da (6) grad WE (x (0) + 
Fe 
+ ÿ vi(é)gradwi(x(t)); t=0,1,...,N, 
=1 


où l’on convient que 1 (0) — 0, Hy4, = 0. 
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Démonstration. D’après le théorème 34.6, l’ensemble 
de tous les points x € E” pour lesquels le vecteur x — x (t) a un 
produit scalaire non positif avec chacun des vecteurs 


grad ui (æ (#)), 1€ L: (x (t)), (43.6) 


est la coupole de l’ensemble Y; au point x (#) (ici £ est un nombre 
fixe qui peut prendre une des valeurs suivantes: 0, 1, ..., NW). 
Dans le théorème 43.1, on peut supposer que c’est de cette coupole 
de l’ensemble X; qu'il s’agit. 

La condition (B) du théorème 43.1 signifie que le vecteur 


T4 


gradzx Hu (td (t), u (t41))—14 (+ D a(é)grad WE (x(t)) (43.7) 


œ—=1 


a un produit scalaire non positif avec tout vecteur dont la direction 
appartient au cône Q;. 

Ainsi, la direction du vecteur (43.7) appartient au cône dual 
D (Q:;) et, donc, le vecteur (43.7) s'exprime sous forme de combinai- 
son linéaire des vecteurs (43.6) à coefficients non négatifs. On peut 


ajouter à cette combinaison linéaire les vecteurs grad u% (x (t)) pour 
lesquels jé Z;(x (#)) en les prenant avec des coefficients nuls. Il en 
résulte que le vecteur (43.7) peut se mettre sous la forme 


p 
— S vj (6) grad wi (x (t)), (43.8) 
j=1 


où tous les coefficients v; ({) sont non positifs et l’on a v; (&) = 0 
pour jé Z;(x(t)). En égalisant les vecteurs (43.7) et (43.8), nous 
obtenons la deuxième relation de la condition (B”). Mais si, en outre, 
Vj (4) = 0 pour jé Z; (x (9) et wi (x (9) = 0 pour j € I: (x (t)), on 
a v;(t) wi (x (t)) — O pour tous les j — 1, . .., ps, i.e. on a égale- 
ment la première des relations de la condition (B'). 

Nous énoncerons maintenant un théorème encore plus général 
(pour le cas du probbème à restrictions de phase) dont les théorèmes 
ci-dessus sont des cas particuliers. La démonstration de ce théorème 
s’obtient d’après le théorème 36.8 et elle est tout à fait analogue 
à la démonstration des théorèmes 42.1, 42.6 et 43.1. 

Théorème 43.5. Soit (40.3) une certaine commande et (40.4) 
la trajectoire correspondante (à état initial x (0) € M,) pour l'objet 
discret commandé (40.1), (42.1), les inclusions x (t) E Mi, t = 1,... 
..., N étant satisfaites. Supposons, d'autre part, que pour tout 
t — 1, ..., N l’ensemble U, est de la forme 


U=ananern none n...net 


$ 12) CONDITIONS NÉCESSAIRES D'OPTIMALITÉ 395 


tandis que l’ensemble M. pout tout t = 0, 1, ..., N est de la forme 


M=RNIENNPN... Ale NEPN... NES, 


où l’ensemble Q; se détermine dans l’espace des variables u!, . .., u” 
par le système d'équations 


CU au )=0, Jeter 


l’ensemble Q se détermine par le système d’inégalités 
gi (u’, Ses u”)<0, i— À, ..) Qt) 


l'ensemble IT; se détermine dans l’espace des variables xt, 7 
par le système d'équations 
W£ (xl, ..., a) = 0, j=1,... r., 
L'ensemble IIS se détermine par le système d’inégalités 
Del is ve" 0; i— 4, ..., Dr; 
(,) -(m;) | 
Qf9, ..., Q;! , 80 ..., & ? sont ds si de l'espace 
: ) (8_) 
des variables ul, ..., u” tandis que IS, .. Te D ro de: 
sont certains ensembles de l’ espace des var iables x, Fe Si Lpposons 


enfin que KŸ est la coupole de l’ensemble QŸ au point u (#), LP la 
coupole de E$° au point u(t), P® la coupole de l’ensemble IŸ au 
point zx (x), co la coupole de l'ensemble 22 au point x (t). Nous 
supposerons toutes les fonctions Gi, pas Wi. uw, sont régulières et que 


pour tout t — 1, ..., N le système de cônes convexes L® Gt ss) 
ne possède pas, dans l'espace des variables u}, ..., u”, la propriété 
de séparation, tandis que pour tout t = 0, 1, , N le système de 
cônes convexes QŸ (j = 1, Se) Ré possède p pas la propriété de 
séparation dans l’espace des variables Le 

Pour l’optimalité du processus (40.3), (40. 4) Fe le sens du mini- 
mum de la fonctionnelle (40.5), étant données les restrictions x (t) € M, 


É — 0,1, ..., N), il est nécessaire qu’il existe un tel nombre 5 < 0 
ei de tels vecteurs 
4 (£) = {1 (6), ..., Ya (t)}, = lis sue 


PC) = {qs (), -.., qu) 1=1,..., N; 
À (6) = {ui (6), -.., do, ()} il, NN; 
pu (£) = {pu (6), ..., Ur, ()}; t=0,1,..., N; 
V( = {Vv(), ..., DE t—=0,1,..., N; 
a, i = 1, lie t—1,..., N;: 
D, i—1,..., n;: 01, ss N. 
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que la direction du vecteur as? appartient au cône dual D (Kf), la 


direction du vecteur bŸ appartient au cône dual D (PŸ)) et les condi- 
tions suivantes (A)-(E) sont satisfaites, la fonction H}; (x, u) que l’on 
y rencontre étant définie par l'égalité 


H; (x, u) = Vofi (x, u) + 2 0) fi(x, u)+ 


“ | a 
F3 > pit) Gi (u) + 2 Ào (£) 8% (u) : 


(A) si d, — 0, alors, pour au moins une valeur de t, au moins un 
des vecteurs 1 (t), @ (4), À G), m (#), v tt), af), 0 est non nul; 
(B) pour tout t — 0,1, ..., N et pour tout vecteur 8x dont la 
direction appartient à l'intersection des cônes Q$) (i = 1, ..., s), 
on a l'inégalité 
(—4 (6) + grads Hi41(x (0), u(t+1)) + 
ee 


+ 2 D (£) grad WE (x (#)) + ji Va (£) grad wY (x (t)) — 


où l’on convient que 1 (0) — 0 et Hx4, = 0; 


(C) pour tout t — 1,..., N et tout vecteur ôu dont la direction 
appartient à  Dinlerseetion de cônes LS? (i — 1, ..., nu), on a l'iné- 
galité 


PRE 
(grad,H,(x(t— 1), u (t))— } a) Su Lo; 
=1 


(D) A, (4) <0, v; (T7) << 0 ei tous les re se dite 
ed 1. Des Cr 0 À: 

(E) À; (0) g (u (6) 0) V; (T) aite (o) 0) pour tous Les j — 
= ds AS OR AN 


+ dt; 
Dans rl énoncé du ‘théorème 43.5 Li, my, Na, S+, ki, Qu, r, ps peu- 
vent être des nombres non négatifs quelconques. En supposant que 
certains d’entre eux sont nuls, nous pouvons obtenir une série de 
cas particuliers du théorème 43.5. En outre, on peut supposer, dans 
l’énoncé du théorème 43.5, que pour tout £ — 1, ..., N certains 


des ensembles 0 sont des hypersurfaces, certains se déterminent 
par des népulitée de la forme hf (u) SO et d’autres sont des en- 
sembles quelconques qui possèdent une coupole L®), La même chose 
se rapporte aux ensembles >). Ce qui permet de varier encore plus 
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les différents corollaires du théorème 43.5. Par exemple, le théorème 
43.1 s'obtient du théorème 43.5 en posant 


g = =0, p. = n; = 0, mi = 1;s:=1 
Get ss a NT, Less NV). 


De même, le théorème 43.4 s'obtient du théorème 43.5 pour g; — 
= = 0, n —= 5, — 0, m — 1 (remarquons que du point de vue 
formel nous avons obtenu un résultat plus fort, puisque pour l’ap- 
plication du théorème 43.5 il n’est pas nécessaire que le système de 
restrictions (43.5) soit non dégénéré au point x (f); mais si ce systè- 
me de restrictions n’est pas non dégénéré, alors l’assertion du théo- 
rème 43.4 perd toute sa signification ; Comparer à la remarque 36.6). 

Remarque 43.6. D’après le théorème 34.2, la condition 
imposée sur les ensembles QŸ, #9, IIŸ), 3% Gans l'énoncé du 
théorème 43.5 sera satisfaite si ces ensembles sont convexes et si 
l'on choisit pour KŸ, Lf, P%, 0% les cônes d'appui de ces en- 
sembles aux points correspondants. De même, ces conditions seront 
remplies si les ensembles Qf, #f° se déterminent par un système 
de restrictions localement concaves (comparer au corollaire 
36.17) de la forme 


E (u) <0,..., EX (u) 0, 


et si l’on choisit pour KXŸ, L{ l'intersection des demi-espaces 
(u — u (?)) grad Ë (u Œ) SO, à = 1, ..., &, 

(et d’une façon analogue, pour I, X%). Il est également possible 

que certains des ensembles œ a IIS, 3% soient convexes 

et d’autres se déterminent par des systèmes de restrictions locale- 

ment concaves. 

44. Théorème d'existence. Les théorèmes démontrés ci-dessus 
(ainsi que plus loin, voir n°% 45, 46) ne contiennent que des condi- 
tions nécessaires d’optimalité. Par conséquent, pour qu'une 
solution du problème de commande optimale obtenue à partir de 
ces théorèmes soit entièrement établie, il est toujours nécessaire de 
faire appel à des considérations supplémentaires. Supposons même 
que l’application des conditions nécessaires au problème de com- 
mande optimale posé s’est avérée particulièrement heureuse, et 
nous avons pu établir qu’il n'existe qu'un seul processus qui 
satisfait aux conditions nécessaires énoncées dans le théorème 43.5 
(ou 42.6). Mais cela signifie seulement que le fait suivant est démon- 
tré: si un processus optimal existe pour le problème considéré, alors 
ce sera le processus que nous avons obtenu, mais cela ne signifie aucu- 
nement que le processus trouvé est effectivement optimal (puisqu'il 
peut arriver qu'il n'existe pas de processus optimal, i.e. aucun 
processus n'est optimal, y compris celui qu’on a trouvé). 
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Néanmoins, si nous savons, d’après certaines considérations, que 
le processus optimal existe certainement, alors il ne peut être 
que le processus trouvé, puisque les autres processus ne satisfont 
pas à la condition nécessaire, et donc ne sont certainement pas 
optimaux. Le théorème ci-dessous donne des conditions suffisam- 
ment commodes qui garantissent l'existence d’un processus opti- 
mal *). 

Théorème 44.1. Supposons que les fonctions fi(x, u) (voir 
(40.1), (40.5)) sont continues relativement aux variables x, u, les en- 
sembles M5, U;, ..., Un sont compacts, tandis que les ensembles 

1, <<. MN sont fermés. Supposons, de plus, qu'il existe, pour 
l’objet (40.1), (42.1), au moins un processus qui satisfait aux restric- 
tions de phase x (1) E M:, t — 0, 1, ..., N. Alors le problème de 
commande optimale (40.1), (42.1), (40.5) à restrictions M; sur les 
coordonnées de phase possède une solution (i.e. un processus optimal 


existe). En particulier, si les fonctions f; sont continues et les ensembles 
U;, ..., UN sont compacts (et non vides), alors le problème fonda- 
mental (voir page 23) possède une solution. 

Démonstration. Désignons par W, l’ensemble de tous 
les points de la forme f, (x, u) où x € M,, u € U,. Comme M, et U, 
sont compacts, et la fonction jf, est continue, W, est un ensemble 
compact. Il est clair que pour chaque processus de l’objet considéré 
(à état initial x (0) € M), on a l'inclusion x (1) € W,. En tenant 
compte de la restriction de phase x (1) € M,, nous obtenons l’inclu- 
sion æ(1) € M, N W;. En même temps, puisque l’ensemble M, 
est fermé, l’ensemble M, N W, l’est également et sera, par consé- 
quent, compact (car W, est compact). Désignons ensuite par W, 
l’ensemble de tous les points de la forme j, (x, u) où x € M, NN W, 
u € U3. L'ensemble W, est compact et pour chaque processus de 
l’objet considéré (à restrictions de phase x (0) € M,, x (1) € M), 
on a l’inclusion x (2) € W,. Prenant en considération la restriction 
de phase x (2) € W;, nous obtenons l'inclusion x (2) € M, N W, 
l’ensemble 47, N W, étant compact. 

En continuant de cette manière, nous construirons pour tout 
t— 1,..., N un ensemble compact M; N W;, tel que pour chaque 
processus satisfaisant aux restrictions de phase x (f) € M; (t — 
= 0, 1,..., N), on a l'inclusion x (t) € M3 N W;. Pour unifier 
les notations, désignons par W, l’espace £" de toutes les variables 
2, ..., æ"; alors l’inclusion x (0) € M, peut également se mettre 
sous la forme zx (0) € M, N Ws, de sorte que la relation x (€ 


*) Des conditions d'existence d’un processus optimal pour des systèmes 
discrets d’une forme plus particulière ont été obtenues dans le travail de 
A. I. Propoy Sur le principe du maximum des systèmes de commande discrets, 
Automatika et télémékhanika 26, n° 7, 1965 (en russe). 
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E M: N WA, sera satisfaite pour tous les £ — 0, 1, ..., N. Aïnsi. 
chaque processus de l’objet (40.1), (42.1), qui satisfait aux restric- 
tions de phase x (f) € M; vérifie également les inclusions x () € 
EM: N Wi, l’ensemble 17; N W,; étant compact. 

Eïffectuons maintenant la substitution (42.6) dans laquelle £ 
varie de O0 à W. Alors les relations (40.1) se transforment dans les 
équations (42.5) (voir (42.4)) et les inclusions (42.1) prennent la 
forme uy E Ur, t = 1, ..., N. Ainsi, la substitution (42.6) trans- 
forme l’ensemble de tous les processus de l’objet (40.1), (42.1) satis- 
faisant aux restrictions de phase x (t) € M;, en un ensemble de tous 


les points de l’espace E* de la variable z — (x, u) qui satisfont 
aux équations (42.5) et aux inclusions x: € M: N W,, u EU. 


@—0,1,..., N;TtT—1, ..., N). Désignons cet ensemble par Q. 
Il est à remarquer que les inclusions zx; € M3 N W;, u,. EU. 
G—=0,1,..., N; t—1, ..., N) déterminent dans l’espace E* 


un ensemble compact (car les ensembles #7, N W, et U. sont 
compacts); désignons-le par P. Quant aux équations (42.5), elles 
déterminent dans l’espace E* un certain ensemble fermé Q 


(d’après la continuité des fonctions f; (x, u)). Par conséquent, l’en- 
semble Q — P AN Q est également compact. En outre, cet 
ensemble est non vide, puisque, d’après l'hypothèse, il existe 
pour l’objet (40.1), (42.1) au moins un processus qui satisfait aux 
restrictions de phase x (ti) € M4. 

Ainsi, la substitution (42.6) réduit le problème discret de com- 
mande optimale (à restrictions de phase) au problème du minimum 
d’une fonction F° (z) continue (voir (42.3)) définie sur un ensemble 
compact non vide Q. Il est bien connu que dans ce cas le minimum 
est atteint, 1.e. il existe un point z, € Q dans lequel la fonction 
F9 (2) restreinte à l’ensemble Q atteint son minimum. Mais alors le 
processus qui correspond au point Z,, d'après la substitution (42.6), 
est optimal. 

Remarquons qu’en compliquant à peine ce raisonnement, on peut 
démontrer un théorème analogue non pas pour le processus (40.1), 
(42.1), mais pour le processus (40.1), (40.2), à condition que les 
ensembles U; (x) soient compacts et non vides et qu’ils dépendent 
continûment de x pour tout { — 1, si: 

À titre d’ exemple voyons comment s'applique le théorème 43.4 
au problème du maximum du produit, considéré dans l’exemple 9.2 
et résolu dans len° 39 par le méthode de programmation dynamique. 
Signalons tout d’abord que, sous la forme du problème énoncé, le 
domaine de commande U;(x) dépend en fait de x, ce qui gêne 
l’application des méthodes exposées dans les n°5 42,43. Néanmoins, 
si l’on supprime la restriction u < a — x}, en exigeant que la 
somme des nombres uw (1), ...,u (NW soit inférieure ou égale à a 
(i.e. x! (N) < a), on obtiendra alors un problème un peu différent 
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(mais équivalent) dans lequel le domaine de commande U sera 
constant. 
Ainsi, nous considérons l’objet (40.1) où 
fiat, 22, u)=zt+u, fiat, a, u)=mu; 1—1,..., N, (44.1) 
à domaine de commande constant U défini par l'inégalité 
u > 0 (44.2) 


et nous imposons la restriction x! (W) < a sur l’état de phase ter- 
minal. Si nous introduisons la fonction 


wn =t!(N)—a, 
cette restriction s’écrira sous la forme 
wi O0. (44.3) 


Nous avons obtenu le problème de commande optimale pour l’objet 
(40.1), (42.1) (voir (44.1)), à domaine de commande constant (42.2), 
l’état de phase initial x! (0) — 0, 2°? (0) — 1 étant donné, tandis 
que l’état terminal est sujet à la restriction x (NW) € M, où l’ensem- 
ble M, est défini par l'inégalité (44.3). Pour cet objet, on considère 
le problème du maximum de la fonctionnelle (40.5), où ff — ... 
Lu NN SO Ni Tu) Tu, 

Soit u (t), x (t) le processus optimal. D’après le théorème 45.4, 
il existe de tels nombres 1, > 0, v, (NW) < 0 (dans la suite nous 
écrirons simplement v au lieu de v, (W)) et de tels vecteurs 


d (2) = {1 (0), Ve ()}, t=1,..., N, 

que l’on a les conditions (A), (B’}), (C). La condition (B') dans le 
cas considéré se met sous la forme *): 

UN =v;, mO=WmE+1), 1=1,...,N —1; 

Va (NV) = 0; Pa (NW — 1) = pou (N) + Pa (W) u (W); 

do (D = WE +LDu(t+t), 1=1,..., N —2. 
On obtient directement de ces relations: 
V () = v, Lt, 53e 


pe (9 = dou (+ 1): cu (MN), = 1, ..., N—14; 4, (W) = 0. 
Mais si u ({) — 0, pour au moins une valeur de t, alors, d’après 
(44.1) on à 2x? (9) — ... — x? (N) — 0, et, par conséquent, la 


*) Nous n’écrivons la condition (B') que pour & = 1, ..., N. La relation 
(B”) pour & — 0 contient les grandeurs ui (0) (car l’ensemble M, se détermine 
par les équations x? (0) — x; — 0, i = 1, 2). Par conséquent, la condition 
(B”), pour t — 0, permet, dans le cas considéré, de définir les nombres u, (0), 
H, (0), mais ne donne aucune nouvelle information sur les grandeurs 1,, 1; (é). 
Cet état de choses est typique pour des problèmes à extrémité gauche fixe. 
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fonctionnelle (40.5) s’annule. Laissons de côté ce cas (qui ne peut 
évidemment donner la solution du problème), i.e. considérons les 
processus pour lesquels uw (£) Æ 0, t—1, ..., N. Alors ôu dans 
la condition (C) (voir théorème 43.1) peut prendre des valeurs posi- 
lives aussi bien que négatives et la condition (C) se met donc sous 
la forme 


Po%* (N — 1) + 1 (N) + a (W) 2° (NW — 1) = 0, 
Vi CE) + be Wa G—-1)=0, 1=1,..., N —1. 


Substituant ici les valeurs trouvées ci-dessus pour 14, (t), 1, (6), 
nous obtenons 


Vor? ON — 1) = —v, pu ( — Lui +1).....u(N) = —\, 
(44.4) 
ts ss ssN TE 


On voit donc que 1, = 0 (autrement, on aurait v — 0, et donc 
V1 () = Ye (#) = 0 pour tous Les #, ce qui contredit la condition (A)). 
Comme, en outre, x? (NW — 1) 0 (d’après l'hypothèse affirmant 
que tous les nombres w (f) sont non nuls), on a v 0. Aïnsi, y, > 0, 
v << 0. De la relation vw (x (N)) = 0 dans la condition (B’), nous 
obtenons maintenant ww (x (N)) — 0, i.e. x! (N) = a. 

D'autre part, ayant en vue que 2°? (f) = u (4): ... -u (t) 
(voir (40.1), (44.1)) et en multipliant la première des relations (44.4) 
par u (N) et la deuxième par w (ft), nous obtenons 


VUu(N) = nu), Let is NT, 


i.e. u (1) = ... = u (N). Mais si u (1) + ... Lu (N) = a, nous 
avons en définitive 
u(l) =. =u(N)= +. 

Ainsi, il existe un seu | processus qui satisfait aux conditions 
nécessaires indiquées dans le théorème 43.4. D’après le théorème 44.1 
(qui est applicable, puisque la relation w (1) + ... + u (N) — 
= xt (N) < a implique que 0 Lu(t) La,t —1, ..., N,i.e. cha- 
cune des grandeurs ne peut varier que dans l’ensemble compact 
U* — [0, al), ce processus est effectivement optimal. Nous avons 
donc retrouvé le résultat obtenu aux pages 861-362 par la méthode 
de programmation dynamique. 

45. Objets discrets à domaine de commande variable. Jusqu'ici 
nous n'avons considéré que des objets pour lesquels, pour chaque #, 
le domaine de commande ÜU; (x) — U; ne dépend pas de x. Ici nous 
éliminons cette restriction, i.e. considérons l’objet (40.1), (40.2) 
sous sa forme générale. Nous nous limiterons ici au cas où l’ensem- 
ble U; (x), pour tout x — (xt, ..., x") € E", est donné par un 


26—01208 
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système d’égalités et d’inégalités de la forme 
Gi(zt, a", ut, ..., w)=0, j—1,..., ka: (454) 
BEL ess Do Uliases DIE lise dr (45.2) 
Relativement aux ensembles 7,, nous conserverons toutes les 


hypothèses contenues dans le thèorème 43.5, i.e. nous supposerons 
que 


M=Mnmnnen...nmonxen...nx"?, (45.3 
où l’ensemble IT; est défini dans l’espace des variables xt, . .., x" 
par le système d'équations 
WÉ (xt, ..., x") 0, j=l rs (45.4) 
l’ensemble Il; est déterminé par un système d’inégalités 
WE (xt, sut ed il; De (45.5) 
et II, = LL ve. DS ; , x69 sont certains ensembles de 


l’espace des ble xl, ..., x". Toutes les fonctions G;, gi, Wi, wi 
sont supposées régulières. 

Théorème 45.1. Considérons l’objet commandé (40.1) (40.2) 
où l’ensemble U; (x) se détermine pour chaque x = (x!, ..., x") € E" 
par le système de relations (45.1), (45.2). Supposons de plus que pour 
chaque t — 0, 1, ..., N, on se donne un ensemble M}; de la for- 
me (45.3) (voir (45.4), (45.5)). Soit (40.3), (40.4) un certain processus 
(pour l’objet considéré) satisfaisant aux restrictions de phase x(t) € M:, 
be 0: Ts SUN a que pour chaque T = 0, 1,...,N 
des cônes convexes P®, OË (Gi—1,..., n3 j=1Â, ..., 8) de sommet 

x (t) sont donnés dans l’espace ET et sont les coupoles au point x (rt) 
des ensembles H®, 39 respectivement : pour chaque t = 0, 1, 

. N le système de cônes convexes Q9 sil es ne on 
pas dans E” la propriété de séparation. 

Pour l'optimalité du processus considéré (40.3), (40.4) (dans le 
sens du minimum de la fonctionnelle (40.5), à restrictions de phase 
x (DEM:, t = 0, 1,..., N), il est nécessaire qu'il existe un tel 
nombre 1) < 0 et de tels vecteurs 


db (ë) = {V1 (6), -.., a ()} 


t N 
@ (£) = {pa (8); -.., qu, (t)} EE PTE LE 
À (t)= {A (é), -.. A, (O)} t—1,..., N: 
u (t) = {lu (£); . ‘9 Ur, (£)}; 0 Tru 
v (4) = {vi (6), sv Oh 0 ls, 
b$) : en nr, t—0,1,..., N. 
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que la direction du vecteur bŸ appartient au cône dual D (PŸ) et l’on 
a les conditions suivantes (A)-(E), dans lesquelles figure la fonction 
H; (x, u) définie par l'égalité 


His, u)= off (a, u) + Xi ve (9 fé (e, u)+ 
“ 


+ 
2 Pa (t) GE (x, u) 2 Aa (t) ga (x, u) : 


(A) si W, — 0, alors, pour au moins une valeur de t, au moins un 


des vecteurs 1 (1), @ (#), À (té), pa (é), v (6), b® est non nul: 
(B) pour chaque t—0, 1, ..., N et pour chaque vecteur dx dont 


la direction appartient à l'intersection des cônes QŸ The 45), 
on a l'inégalité 


dr: 
(— 1 () + gradzx 444 (x (8), u (+ 1)) ra Me (#) grad WÉ (x (#)) + 
P4 gi = 
+ D vw (t) grad ut (x (t))— D bŸ )6x<O, 
a=1 J—=1 
où l’on a convenu que 4% (0) = 0, H x+41 = 0; 
(C) grad,, H; (x NA D u (#)) = 0, t— 1, “NS 
(D) À () < 0, À () ge (x (t — 1), u (6) — 0 pour tous les à — 
Â, .. . Qt el so N ; 
(E) ve (4) 0, v, (t) wé (x (#)) = 0 pour tous les &« = 1, ..., p+; 
N 


e LR | 


D émonstration. La substitution (42.6) réduit le problè- 
me discret de commande optimale au problème du minimum de la 
fonction Æ° (z) (voir (42.3)) restreinte à l’ensemble Z* décrit par le 
système d'égalités (42.5), (45.1), (45.4), le système d'inégalités 
(45.2), (45.9) et le système d’inclusions 


z, CIS”, SE cs Pt; t—0, 1, …..) N ; 
r, EX, D PR AC RE À 


Ceci donne la possibilité d'appliquer le théorème 36.8. D'après. 
ce théorème, il existe de tels nombres 


PoS0, Vi, i=1,...,n; t— 13 Ne 
pi: j—1,..., k,; = NN 
A, El, (æ(t—1),u(t)), t=1, ..., N; 
u}, k—1, ..., T4; t—0, RE N ; 
vé jEJi(x(t)), 0, 1,34. 
26* 
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et de tels vecteurs bp dl 22000 TE N que l’on 
a les conditions du dhésrène 36.8. Ici par J; (x (t — 1, u (t)) nous 
avons désigné l’ensemble de tous les nombres i — 1, ..., q; pour 
lesquels on a l'égalité g3 (x (£t — 1), uw (#)) — 0, et par J; (x (6) 
l’ensemble de tous les nombres ÿ — 1, . .., p; pour lesquels l'égalité 
wi (x (t)) = 0 est remplie. D’autre part, le vecteur bŸ” a une direc- 
tion qui appartient au cône D (Pf)). Enfin, la condition (B) du 
théorème 36.8 prend ici la forme suivante (où par z, on a désigné 
Je point qui correspond au processus (40.3), (40.4) en vertu de la 
substitution (42. 6)) : 

N 


2 (to grade, F° (a) + 
N 
HE pi » Va grade, F3 (u)) das + à (po gradu. F° (20) + 
+ SD vendu, FFG)ôur+ D D D @ù x 


N k,, 
X (ôx; gradx, Gy eo) + à 2 21 pY (Ou. gradu, Gy (z0)) + 


LD 


N ON ‘y 
+ > uY (x gradx, W (20)) + 
#=0 y=0 à—1 
N N 
+ 2 D D Aa (ôx: gradx, 8% (20) + 
t=0 y=1 
N ON 
+ 3 2 2h (8u gradu, 87 (20) + 
T=1 y=1 © 
N NN Ne. ft. 
HN > > à (dx: gradx, wh (2))— D > bO8:<0 
ra y=0 B 1=0 i=1 
pour tout vecteur Ôz — (ôx;, Ôu.) qui possède la propriété suivante: 
pour tout { = 0, 1,..., N la direction du vecteur ôx, appartient 
à l’intersection des cônes Qf (i — 1, ..., s,). Ici toutes les valeurs 


192 vÉ sont non positives et l’on suppose que dans toutes les sommes 
où l’on n’a pas indiqué les limites de variation des indices «&, B la 
somme s'effectue sur @ € 1, (x (y — 1), u (y)), BE J, (x (v)). Mais 
si l’on pose 

A0 =0 pour a@l,(r(y—1), u(v)) et vÿ—0 pour BéJ,(x(v)); 


on peut admettre que la somme s'effectue sur tous les & = 1, 
…, y et B — 1, ..., p,, tandis que toutes les valeurs AG, va 
que l’on rencontre sont non positives. 


$ 12] CONDITIONS NÉCESSAIRES D'OPTIMALITÉ 405 


Supposons maintenant que 6 est un des nombres 0, 1, ..., A. 
Posons ôu. — 0 pour tout t. En outre, posons ôx; — 0 pour t-Æ 0 
et pour xs Choisissons toujours des vecteurs quelconques dont la 
direction appartient à l'intersection des cônes Q$ ,i—1,...,580. 
Le vecteur 82 — {ôx;,, Ôu.} ainsi obtenu possède la propriété sui- 
vante: pour tout £ — 0, 4, ..., N la direction du vecteur Ôx, 


appartient à chacun des cônes Oi,i—1,..., sset, par conséquent, 
ce vecteur doit satisfaire à la condition (B) écrite ci-dessus. En tenant 


compte de la forme des fonctions F°, Fi. Gi, W, gi. w;, nous obtenons 
ici la condition (B) du théorème 45.1: il suffit de poser 


Va (0 =D, Pa (it) = Dés La (9) =Ué; Na ()= Aus Va (#) = vi. 


Choisissons ensuite un 6 quelconque (1 << 8 < N) et posons 
ôu. = 0 pour t # 6; en outre, posons x; — O0 pour tous les f; 
enfin, pour ô%, nous prendrons des vecteurs arbitraires. 
Pour le vecteur 8z — {ôx;, Ôu,} ainsi obtenu nous aurons également 
la condition (B) ci-mentionnée, ce qui nous donne justement la 
condition (C) du théorème 45.1. Enfin, la validité des conditions 
(A), (D), (E) se vérifie directement. 

Remarquons que si les fonctions (45.1), (45.2) ne dépendent 
pas de x, i.e. déterminent un domaine de commande ÜU; constant, 
alors le théorème 45.1 se transforme en un théorème du type consi- 
déré dans le sous-paragraphe précédent, à savoir dans le théorème 
43.5 pour le cas l; — m; = 0. 

46. Principe discret du maximum (méthode des sections locales). 
Dans ce sous-paragraphe nous donnerons une autre solution du 
problème (très généralisé) de commande optimale pour un objet 
discret à domaine de commande variable. 

Nous dirons que l’objet (40.1), (40.2) possède des sections loca- 
les *), si pour tous #, æo, u, qui satisfont à la condition ws € U: (to), 
on peut trouver une fonction régulière ;, (x), définie dans un certain 
voisinage du point x,, à valeurs dans l’espace des variables u!, 


., u”, telle que 


x (x) € Us (x) et %4 (to) = wo. 
La fonction y; (x) sera appelée section locale correspondante aux 


valeurs {, xs, u, choisies. Il est à noter que la fonction %; (x) est 
supposée régulière, i.e. elle possède des dérivées partielles continues 


Ox} (x) 
Or? 


mais l’on n’impose aucune condition (même pas la condition 
de continuité) sur la façon dont la fonction y; (x) dépend de x5, us- 





9 i—= À, .….., T', 11; ..., n ; 


*) Cette terminologie est empruntée de la théorie des fibrations qui est une 
des branches les plus importantes de la topologie moderne. 
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Remarquons, d'autre part, que si pour l’objet (40.1), (40.2) les 
domaines de commande ne dépendent pas de x, i.e. sont de la for- 
me (42.1), tandis que les fonctions f; (x, u) sont continûment diffé- 
rentiables en x, alors cet objet possède nécessairement des sections 
locales. En effet, supposons u, € U;. Posons %; (x) = w,; alors 
X: (x) est une section locale (définie dans ce cas non seulement 
localement, i.e. non seulement dans un voisinage d’un point fixe x,, 
mais dans tout l’espace E”). 

Théorème 46.1 (principe du maximum). Con- 
sidérons l’objet commandé (40.1), (40.2) qui possède des sections locales. 
Désignons par V; (x) le sous-ensemble de l’espace E"*! (de dimension 
n + 1) qui contient tous les points 


fetx, u)=(f?(x, u), fi(x, u), ..., ff (x, u)), 
obtenus lorsque u parcourt l’ensemble U; (x) et supposons que pour 
tout point x € E" et tout t — 1, ..., N l’ensemble V, (x) est compact, 


convexe et dépend de manière continue de x € E". Les fonctions f+ (x, u) 
sont supposées continûment différentiables en x, u. Supposons, en 
outre, que l’on se donne des ensembles M, t — 0, 1, ..., N de la 
forme 


M,=mfn...ntm”, 
où IIS sont certains ensembles de l’espace E". Supposons que (40.3), 
(40.4) est un processus de l’objet considéré qui satisfait aux restrictions 
de phase x) EM, t —0,1,..., N et soit P) Ja coupole de l’en- 
semble IIS” au point x (#). Choisissons pour tout t — 1, ..., N une 
certaine section locale y; (x) définie dans un voisinage du point x (t — 1): 
X: (x) E Ui (x), kr (x (GE —1)) = u (6), ARS CE N. 


Pour l’optimalité du processus (40.3), (40.4) considéré (dans le sens 
du minimum de la fonctionnelle (40.5), à restrictions x (t) € Mi), il 
est nécessaire qu'il existe un tel nombre 1, < 0 et de tels vecteurs 
4 () — {Un (6), . .., MO Lelsesu Ns 
DS, i=1,..., nr; t=0, 1, ..., N, 


que la direction du vecteur bŸ appartient (dans l’espace E*) au cône 


dual D (PS) et les conditions suivantes (A)-(C) sont satisfaites, les 
fonctions H, (x, u), HŸ (x) qui y figurent étant définies par les égalités 


Hi(e, u)=vfi(e u)+ 2 fie, uv); Hf(e)= He x (r): 


(A) si w, — 0 alors, pour au moins une valeur de t, au moins un 
des vecteurs 1 (t), bŸ° est non nul; 
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(B) 4 (9 = grad Hf,4 (x (8) — D b® #1—0,1,..., N,où l’on 


a convenu que 1 (0) = 0, H$41 = 0: 
(C) Hy;(x (t—1),u ()— max Hy(x(t—-1),u), t—1,...,N. 
uEU (xt —1)) 


Remarquons, pour éviter les malentendus, que pour calculer le 
vecteur grad HË,1 (x (t)) il est nécessaire d'appliquer la formule 
de la dérivée complète: 

Hi CG) OHis(x (6), (+1) | 

ôx? Ox | 


4 Oui ôxi 
J3=1 


Démonstration. Tout d’abord, reformulons dans une 
certaine mesure le problème de commande optimale posé. Introdui- 
sons de nouvelles variables w°, vl, ..., v" et désignons par Æ"*t 


l'espace de ces variables. Pour tous les x, u donnés, le point f; (x, u) 
qui possède les coordonnées 


Det, iv eh dires vf (0 0), (46.1) 


appartient à cet espace. Nous sous-entendrons toujours par frajec- 
toire une suite de points quelconque 


D (0): TD 5 D ÛN) (46.2) 
de l’espace £", mais par commande nous comprendrons une certaine 
suite de points 

D'(1); 5528 ON) (46.3) 
de l’espace ÆE"*t, D'après l'hypothèse du théorème, un certain 
ensemble V; (x) € E"*#1 est donné pour chaque point x € E" et 


chaque t — 1, ..., N. Nous dirons que la trajectoire (46.2) cor- 
respond à la commande (46.3) si l’on a les relations 
VE Vi(x(—1))}, 1—=1,...,N; (46.4) 


s'=v (, i=1,....n;: t=1,...,N. (46.5) 


En qualité de fonctionnelle à minimiser pour l’objet (46.4), (46.5) 
prenons 


J = 0 (1) + uw (2) +... + uw (N). (46.6) 


Les relations (46.4)-(46.6) permettent d’énoncer un problème 
discret de commande optimale. A savoir, il faut trouver un tel 
processus (i.e. une commande (46.3) et la trajectoire (46.2) corres- 
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pondante) qui satisfait aux conditions 
TL (#) € VW}, L — L.  . N (46.7) 


et réalise, sous ces hypothèses, le minimum de la fonctionnelle (46.6). 
Il est évident que le problème (40.1), (40.2), (40.5), (46.7) se 
réduit au problème de commande optimale sous la forme (46.4)- 
(46.7). Cette réduction s’effectue justement par les formules (46.1). 
En effet, soit (40.3), (40.4) un certain processus de l’objet (40.1), 


(40.2) qui satisfait aux restrictions x (4) EM;,;, t—0,1,.... N 
Posons 
v'(t)=fi(r(t—1), u(t)); i=0,1,...,n; 1—1,...,N. (46.8) 


Alors, d’après (40.1), (40.2), nous aurons les relations (46.4), (46.7), 
tandis que la fonctionnelle (40.5) prendra la forme (46.6). En d’autres 
termes, la substitution (46.1) transforme chaque processus de l’ob- 
jet (40.1), (40.2) en un certain processus de l’objet (46.4), (46.5), 
alors que la valeur de la fonctionnelle (40.5) s'avère égale à la 
valeur correspondante de la fonctionnelle (46.6). Les restrictions 
x (t) € M}; restent remplies (puisque la substitution (46.8) introduit 
seulement de nouvelles commandes sans changer la trajec- 
toire). 

Inversement, pour tout processus de l’objet (46.4)-(46.6) (qui 
satisfait aux restrictions x (é) € M;) on peut trouver un processus 
de l’objet (40.1), (40.2), (40.5) que la substitution (46.8) transforme 
en un objet donné. Pour trouver un tel processus, il suffit de ré- 
soudre les relations (46.8) relativement à uw (4), 1 — 1, ..., N, 
ce qui est toujours possible, en vertu de la définition de l’ensemble 
V;, (x). Remarquons que ce passage inverse n’est pas uniquement 
défini en général (à un même processus x (£), v (t) peuvent corres- 
pondre plusieurs processus x (ft), u (f), puisque l'équation 
(46.8) peut avoir plusieurs solutions). Néanmoins, Lous les proces- 
sus x (ti), u (it) qui correspondent, d’après (46.8), à un même proces- 
sus x (t), v (t) donnent la m ême valeur à la fonctionnelle (40.5) 
(cette valeur est égale à celle de la fonctionnelle (46.6) pour le pro- 
cessus x (ti), v (t)). Il reste à noter que si le processus x (t), u (£) est 
optimal pour l’objet (40.1), (40.2), (40.5) avec les restrictions x (6) € 
€ M;, alors le processus x (t), v (t) qui lui correspond, par (46.8), 
sera optimal pour l’objet (46.4)-(46.6) avec les mêmes restrictions 
x (t) E M;, et inversement. Par conséquent, le problème de la recher- 
che des processus optimaux de l’objet (40.1), (40.2), (40.5) équivaut 
à la recherche des processus optimaux de l’objet (46.4)-(46.6). C'est 
ce dernier problème que nous considérerons, pour revenir à l’objet 
(40.1), (40.2), (40.5), une fois ce problème résolu. 

Désignons par E* l’espace des variables x, v?, où i — 1, ..., n; 
ÏJ=0,1,...,n;:t—0,1,..., N:7T7—1,..., N. Sur l'espace 
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E* considérons les fonctions 
F(z)=0u +0 +... +u; (46.9) 
Fi(z)=—xitui, i=1,...,n; t—=1,...,N. (46.10) 


Désignons par Q’ l’ensemble de tous les points de l’espace Æ*, dont 
les coordonnées satisfont au système d'équations 


Fi(z)=0, i=1,...,n: 1—1,...,N; (46.11) 
en outre, désignons par f1{° l’ensemble de tous les points z — (x? vi) 
de l’espace Æ* qui satisfont à la condition x; € II, et par &. 
l’ensemble de tous les points z qui satisfont à la condition 
Ur — (U?, Ur ve Ur) eV: (Zr_1) = Vs (xl _,, EE 17 _,). 
La substitution 
dr (e =0 des Ni sn) 
DD) JO ans At is, (46.12) 
ramène le problème de commande optimale considéré au problème 


de la recherche du point dans lequel la fonction Æ° (z) restreinte 
à l’ensemble 


No N 
z*=9'n(n n H)n(n EE), 
t=0 i—=1 T—=1 


atteint sa valeur minimale. 

Soit (46.2), (46.3) un processus optimal pour l’objet (46.4)-(46.7), 
qui correspond en vertu de (46.8) au processus optimal donné (40.5), 
(40.4) pour l’objet (40.1), (40.2), (40.5) (avec les restrictions x (é) € 
€ M;). En posant 


dia (t), vi=u(r)=fi(c(t—1), u(r)), 


nous obtenons le point z = (ri, D?) dans lequel la fonction F (2), 
restreinte à l’ensemble Z*, atteint son minimum. On peut donc 
appliquer la condition nécessaire d’extrémum du théorème 36.8. 


Pour se servir de ce théorème, désignons par P£ l’ensemble 
de tous les points z = (xi, vi) de l’espace E* qui satisfont à la con- 
dition x; Ee PY, Alors P9 est la coupole de l’ensemble IT) au 
point z(i=1,...,n;; t—0,14,..., N). D'autre part, posons 


4 ()= fe, % (x). 
Alors % (x) est une fonction régulière, définie dans un voisinage 
du point x;_, et l’on a 


X (x) € V: (x) et % (x) = U. 
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Enfin, pour tout 6 — 1, , N désignons par Le l’ensemble de 


tous les points de la rise Z us ôz où + — {ôxt, ôvi} satisfait à la 
condition suivante: 


(a) la direction du vecteur ôvg — S 0 (0-0 gui appartient 
ii 976-1 
au cône Lo, où Le est le cône d'appui du corps convexe Vo (Zo_1) au 
point De. 
L'ensemble Lo est évidemment un cône convexe fermé de l’espace 
E*, de sommet au point z. Démontrons que ce cône est la coupole 


de l’ensemble &4 au point z et que le système de cônes convexes L;, 
D, ., N, ne possède pas la propriété de séparation dans E*. 
Supposons que ce fait a déjà été établi et montrons comment il 
faut terminer la démonstration du théorème dans ce cas. 

D’après l'hypothèse, on peut appliquer le théorème 36.8 (dans 
lequel il faut poser r — q — p — 0) à la restriction de la fonction 
F1 (z) à l’ensemble Z*. En effet, l’ensemble Z* peut être représenté 


sous forme d’intersection de l’ensemble Q” déterminé par le système 
d’égalités (46.11) et de deux systèmes d’ensembles If” et &, ; 


alors nous Connaissons les coupoles PS), L, de ces ensembles au 
point z et nous savons, en outre, que le système de cônes L,,t — 


— 14,..., N, ne possède pas dans E* la propriété de séparation. 
D'après le théorème 36.8, il existe un tel nombre ÿ, & 0, pi (i = 
= 1,...,n;t1—1,..., N) et de tels vecteurs D!” GT, 

...,), M3;t—=0,1,..., N) que la direction du vecteur D£ appar- 


tient au cône dual D (PŸ)) et l’on a les conditions (B), (y) du théorè- 
me 36.8, qui se mettent sous la forme (voir (46.9), (46.10)) : 


N n _N 
(E) À (ho grade, Fe (2) + » à ÿy gradz,Fy (2)) ÔX+ + 


a—1 y—=1 
N . n ON 
2 (bo grad,., F° (2) + > > pr grady, F4 (2)) ôv.— 
— Gi V—= 
NEC 
— Y > 6$8:<0 
t—=0 i-=1 


pour tout vecteur 82 — {ôx:;, Ôv.} dont la direction appartient à l'in- 
tersection des cônes L, (t = 1, ..., N); 
(y) si tous Les nombres 1, VE sont nuls, alors au moins un des vec- 


deurs D est non nul. 
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En se servant de la forme des fonctions Æ° et F7, on peut récrire 


la condition (6) sous la forme 


N N n N n N° TE =. 
Do D ô— D D plôri+ D D prôvi— D D Di 820. (46.13) 
T= 1 t=1 i—=1 t=1 j=1 t=0 i—=1 


Choisissons un entier quelconque 6 (0 < 6 < V), posons tous 
les ôx; pour = 6 égaux à Ô et pour x — {ôx8, . . ., Org} Choisis- 
sons toujours des vecteurs quelconques. En outre, définissons les 
vecteurs ôv; à l’aide des égalités 


n End Pas 
Oxe (rt) à à 
Gus 3, EM Bai 0, 11, ...,N, 


21 


de sorte que la condition (a) soit satisfaite. Autrement dit, 


n _ % 
ÔVg41 — >. Hess 4) Gr, ôv, = 0 pour t-=0+1. 


i=1 6 
Le vecteur 8+ — {ôzxi, ôvi} ainsi obtenu a une direction qui appar- 


tient à chacun des cônes L.,, T—1, ..., N, et l’on a donc la rela- 
tion (46.13) pour ce vecteur. Ainsi, en posant, par souci de commo- 


dité, W—=0(i—=1,...,n), YN41 = 0 (x — 0, 1, ..., n), nous 
obtenons 


SH D Li Spor SN Srpert HO gi 
Vo 2 D: ci > PiOTE + 2) di Ÿ or 5 — 
i=1 


=1 i=1 j=1 
78 
— 5 8x0, 6—0,1,...,N, (46.14) 


1=1 


où b$ est un vecteur de l’espace £" qui possède (relativement aux 
axes x!, ..., x") les mêmes coordonnées que possédait le vecteur 
bé” relativement aux axes x, ..., 8 (les autres coordonnées du 
vecteur Db$? sont nulles, d’après le choix du cône P$)). La relation 
(46.14) est satisfaite pour tout vecteur ôx9 — {ôrb, . . ., Ôx$}, d'où 
l’on déduit la condition (B) du théorème 46.1 (d’après la substitution 
dv (t) = we et la relation X (&) = fs (x, x (x))). 

Enfin, choisissons un nombre 6 (—1, ..., NV), posons tous les 
ôv, pour T6 égaux à 0, et pour ôvg — {ôvb, . . ., Ov} choisis- 
sons des vecteurs dont la direction appartient au cône L. En outre, 
posons ô%; —0 pour tous les #. Le vecteur 84 — {ô%;, Ôv.} ainsi 
obtenu possède une direction qui appartient à chacun des cônes Le 
t=1,..., N, et, par conséquent, il vérifie la relation (46.13). 
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Ainsi, 
n . 
VoÔL8 + > pPôv0<O, 6= 1, AV, 
f=1 
pour tout vecteur Ôvs — {ôv8, . . ., Ôvé} dont la direction appartient 


au cône La. 


n 
Cela signifie évidemment que la fonction \,vé + 2 bEvS restrein- 
= 
te au cône L, atteint son maximum au sommet de ce cône, i.e. au 
point ve. Mais l’ensemble convexe V4 (xo_) est Contenu dans 
son cône d'appui LA (ce qui découle directement de la définition du 
n 


cône d'appui). La fonction wuè+ D vyevg restreinte à l’ensemble 
œ—=1 


V5 (xo_1) atteint donc son maximum au point v9: 


Povè+ D pére max (po+ D per), 0—1,...,N, 
Fe DEV 9 (Xo_1) 
d’où l’on obtient (en vertu de la substitution pi = 1; (4) et de la 
relation (46.8)) la condition (C) du théorème 46.1. Enfin, la condi- 
tion (A) du théorème 46.1 découle dierctement de la condition (y) 
énoncée ci-dessus. 
Ainsi, pour terminer la démonstration du théorème 46.1, il 


[rar 


reste à établir que le cône Z, est la coupole de l'ensemble #, au 
point z et que le système de cônes convexes L,, t — 1, ..., N ne 
possède pas dans £* la propriété de séparation. Choisissons arbitrai- 
rement 0 (= 1, ..., N). Soit z — (x, v.) = (xi, vi) un point du 


cône Le. Désignons par Yo (z) le point de l’ensemble convexe 
V9 (xe-1) le plus proche de ve. D'autre part, désignons par Vo (z) le 
point z — ( Us) qui satisfait aux conditions x; — x3, t — 0, 1, 

y N;09 = Ye (z), v — v, pour t = 0. Ainsi, nous avons Re 
PaSlication Yh: Tips On vérifie sans difficulté que cette 
application est continue (rappelons que l’ensemble V, (x) dépend 
d'une manière continue du point x € E"). 

De l'inclusion 19 (2) € Vo (xo_1) (qui découle de la définition 
du point #4 (z)), on déduit directement (en se servant de la défini- 
tion de l'application WW, et de l’ensemble &;) que W, (2) € &o 
pour tout point z€ Le. Ainsi, l'application Ÿ, satisfait à la con- 
dition 2) de la définition 34.1. 

Montrons que l’application Ÿ, satisfait également à la condi- 
tion 1), ï.e. l’on a la relation W,(z) — z + 0; (z). Pour cela, choi- 
sissons un nombre € positif (inférieur ou égal à un), que nous ne 
changerons plus pendant ce raisonnement. Considérons dans l’espace 
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E"“1 une certaine sphère de centre au point ve et désignons par Ze 
l'intersection de cette sphère avec le cône Z,; (i.e. avec le cône d'appui 
du solide V9 (te) au point ve). Soit Ye € Zoe. Désignons par Lo (Ye) 
la demi-droite issue du point v9 qui passe par le point ye. Soit, 
d'autre part, Z9_, une boule fermée de l’espace £” de centre To 
et de rayon & = 0. Pour un 8 suffisamment petit, la fonction Yo 
est définie sur toute la boule Z4._.. 

Choisissons un point æo_1 € Zo_, et considérons dans l’espace 
E"*# toutes les demi-droites issues du point %e (to_1) qui forment 
avec la demi-droite !, (ye) des angles inférieurs à e. Ces demi-droites 
remplissent dans l’espace Æ"*! un cône convexe fermé que nous 
désignerons par K:,09 (Zo_1, Yo). Comme y4 € 29, i.e. le rayon 
Lo (Ye) est contenu dans le cône L;, il doit exister, aussi près que 
l’on veut de cette demi-droite, des demi-droites issues de 29 et 
passant par les points de l’ensemble Va (toe_1) différents de ve. Par 
conséquent, à l’intérieur du cône K,,,9 (to_1» Ve), on peut 
trouver une demi-droite issue du point v, qui passe par un point 
(qui diffère de ve) de l’ensemble V4 (x9_,). Par conséquent, d’après 
la continuité (en tenant compte de la compacité de l’ensemble 
> 4), on peut choisir le rayon 6 de la boule Z,_, tellement petit, que 
pour deux points quelconques y4 € 26, Zo-1 € Zo_1 il existe à l’in- 
térieur du cône K,, 9 (Zo_1: Ye) une demi-droite issue du sommet 
Yo (To) de ce cône et contenant un point de l’ensemble convexe 
Vo(zo) différent de %o (to). 

Choisissons le nombre ô de manière à satisfaire cette condition 
et convenons de ne plus le changer par la suite. Aïnsi, l’intersection 

Ke, 0 (xe-1, yo) N Vo (xe-1) (46.15) 
contient des points différents de %o (to_1) Situés à l’intérieur du 
cône Ke, 8 (Zo-1r Yo) (Yo € 26: To-1 E Zo-1); évidemment, le point 
Le (Te) est aussi contenu dans cette intersection. L’intersection 
(46.15) est un ensemble compact convexe. On peut facilement véri- 
fier qu'il dépend d’une manière continue du couple des 
variables yo € Zoo, Zo-1 € Zo-1: 

Si l’ensemble (46.15) possède des points en dehors de la boule 
de rayon 1 et de centre au point Yo (Zo_1), posons alors d(x5_1, Yo) — 
— {. Mais si l’ensemble (46.15) est entièrement contenu dans cette 
boule, désignons par d (x9_1, yo) la plus grande distance du point 
%o (To) aux points de l’ensemble (46.15). Il est clair que 
d (to-15 Yo) > 0, puisque l’ensemble (46.15) contient des points 
différents de %e (to-1). D'autre part, la fonction d(xo_1, Ye) est 
continue, car l’ensemble (46.15) dépend d’une façon continue 
des variables z5_,, yo. Ainsi, d (x9_1, yo) est une fonction continue 
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positive dont les arguments parcourent des ensembles bornés 

fermés Zo-1 € Zo-1r Yo E Do. Par conséquent, la valeur minimale 
de d(x9_1, yo) est positive, i.e. il 
existe un tel k > 0 que 


d(xe-1, Ye) >h pour tous les 
T1 € Zo-1, Ye Ze. 


Choiïisissons un nombre h, plus 


l petit que le rayon de la boule 


Z 9-1, de sorte que le vecteur z — z— 
— Ô+—{ô1, vi} a la longueur 


E Il 
ul | qil 
1 al ju |z—2z|< ho, alors le vecteur 
Â 


il D” n 
4 de (0-1) 
vo — Ÿ' br | (46.16) 
À (2.5) ii  976-1 7 


est de longueur inférieure à . Si 

maintenant z € Lo, i.e. le vecteur 

Ôz — z — z satisfait à la condition 

Fig. 458 (œ) pour t = 6, alors la direction 

du vecteur (46.16) appartient au 

cône Le. Il existe donc un tel point ye € 24 que le vecteur (46.16) 
est dirigé le long de la demi-droite {4 (yo). 

Par conséquent, il existe dans l’ensemble (46.15) un point ws 

situé à une distance supérieure ou égale à k du point %o (to_1): 

Le point 


n Las Pas 
Æ ô : , 
So — Lo (to) + (ôve— 3, PEU pri) (46.17) 
ui Moi 
est contenu dans l’axe du cône X,, 4 (xo-1, Ye). Ge même cône con- 


tient également le point w4. Par conséquent, l’angle entre les vec- 
teurs 


So —%o (ox) et We — Yo (Xo-1) 


est inférieur ou égal à e. D'autre part, le premier de ces vecteurs 
(i.e. le vecteur (46.16)) a une longueur inférieure à h et le deuxième 
une longueur supérieure ou égale à h. Par conséquent, le point % 
qui est la projection du point s9 sur la demi-droite issue de Yo (to) 
et passant par le point w4 appartient à l’ensemble V, (x9_) (car 
il est contenu dans le segment qui joint les points 4e (to) et wo de 
l’ensemble convexe V, (to) ; fig. 158). Quant à la distance entre 
les points s, et 56, elle est inférieure ou égale à | so — Le (to_1) | Sin &, 
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i.e. inférieure à 


n 
e|ôve— Y LHCOR ES 
1  9%6-1 


(voir (46.17)). D'autre part, d’après (46.17), 


2 L F 
So = Ye (xe-1) +8ve— © CUS — 
1 T1 


n 
Pt Les 0 —_ 
= 4e (Lo-1 + ÔL0-1) + ÊVo — > À Go Ôxh_, = 
i=1 To _ 1 
= 4e (Zo_4) + 0 (8X0-1) + Vo = Vo + Ô Vo + 0 (8X9-4) = Vo + 0 (Ôôxo_1), 
i.e. la distance entre les points s4 et va est o (ÔX 0 1)- 


Ainsi, la distance entre les points v, et 5 € Vo (xo_1) est infé- 
rieure ou égale à 


n 
e|ôve— > PE. D, + 0 (Ôxo-1). (46.18) 
i=1 6-1 
Par conséquent, la distance entre le point v, et le point be (z) le 
plus proche de l’ensemble V,(xo_) est a fortiori (pour 
| ôz | ho) inférieure ou égale à la valeur (46.18). Comme dans 
ce raisonnement le nombre & > 0 était arbitraire, on a 


lim LYe@)—v%el _)p 
10210 | ôZ | : 
i.e. la relation suivante est satisfaite 


Vo (z) = ve +0: (2), 


ce qui signifie que l'application Ÿ, satisfait à la condition 1) de la 
définition 34.1. Ainsi, L, est la coupole de l’ensemble &, au point 
2, T—4,..., N. 

Il reste à démontrer que le système de cônes convexes L... Le 
= 1, ..., N dans E* ne possède pas la propriété de séparation. 
Désignons par D, (où 8 — 1, ..., N) l’ensemble de tous les points 
Zz = (t;, UV.) qui satisfont aux conditions 


Ti = % pour é—=0, 1,...,N, Dr = Ur pour T=£ 6. 


D'autre part, désignons par D, l’ensemble de tous les points z — 
— (x;, U.) vérifiant les conditions 


| = ô : 2, 
Vi — UV} = ÿ leo Qui ‘ tie LAN. 
i=1 0x 1 
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Il est évident que l’espace ÆE*, considéré comme espace vectoriel 
d'origine z, se décompose en somme directe de ses sous-espaces 
D,, D;,, ..., DYX. Désignons par LS (ou 6 est un des nombres 
1,..., N) l’ensemble de tous les points z = (xi, vi) € Dé qui 


satisfont à la condition vo € Le. Il est aisé de voir que La est l’enve- 
loppe convexe de l’ensemble qui est la réunion du cône 1 CD; 
et de tous les sous-espaces D,, D,, ..., DY\, sauf D,. Par consé- 
quent, le théorème 42.5 implique directement (comparer à la page 382) 


que le système de cônes convexes L,, T—1,...,N, ne possède 
pas dans Æ* la propriété de séparation. 

On peut supposer, dans le théorème 46.1, que pour chaque t — 
— 0, 1, ..., N parmi les ensembles IŸ certains sont des hyper- 
surfaces (dans l’espace £" des variables x!, . .., x"), certains sont 
définis par des inégalités du type w£$ (x) < 0, et d’autres sont des 
ensembles quelconques possédant une coupole PŸ. Il résulte du 
théorème 46.1 que nous pouvons obtenir la proposition suivante 
plus générale. 

Théorème 46.2. (principe du maximum). Consi- 
dérons l'objet commandé (40.1), (40.2), (40.5) pour lequel le domaine 
de commande U; (x) est compact et dépend d'une manière continue 
de x € E", tandis que l’ensemble V; (x) de tous les points de la forme 
f: (x, u), u E U: (x) (voir (46.1)) est convexe pour tout x € E*. Suppo- 
sons ensuite que l'objet considéré possède des sections locales et que les 
fonctions f; (x, u) sont continûment différentiables en x, u. Supposons 
enfin que les ensembles M3, t —=0, 1, ..., N, sont de la forme 

La ” (n ) 
Mi=HnInin...nIk", 
où l’ensemble II? se détermine dans l’espace E" par le système d'équa- 
Lions 


Wi(zxt,...,x)=0, i=1,...,r4, (46.19) 
l’ensemble Il; se détermine par le système d’'inégalités 
wi (xt, ...,2)<0, i=14,...,p4, (46.20) 


tandis que IIS”, i = 1, ..., n, sont certains ensembles de l’espace E. 
Soit (40.3), (40.4) un certain processus pour l'objet considéré, qui 
satisfait aux restrictions de phase x (t) E M}, t = 0, 1, ..., N, et 
soit PŸ la coupole de l’ensemble IIS au point x (t). Nous supposerons 
que dans un voisinage du point x (t) toutes les fonctions Wi,i=1,... 

Ti wi — A, ..., ps, sont régulières. Choisissons pour chaque 
t—1,..., N une section locale y; définie auprès du point x (t — 1): 


ke Ce  — 1)) = u (), x: (x) E Ur (x). 
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Pour l’optimalité du processus considéré (40.3), (40.4) (dans le sens 
du minimum de la fonctionnelle (40.5), avec les restrictions x (t) € M), 
il est nécessaire qu’il existe un tel nombre 1 < 0 et de tels vecteurs 


DD {bi(0, bn 1. N; 
LOS, ss Ok En O 4 ses 
vj={n(t), ...,v,@h 1=0, 1, ...,N; 


pb). i—1Â,...,17u; t— 0, 1, .... N, 


que la direction du vecteur b£ appartient (dans l’espace E") au cône 
dual D (PŸ)) et les conditions (A)-(D) ci-dessous sont satisfaites, la 
fonction H; (x, u) que l’on y rencontre étant définie par les égalités 


He, u)=buft(e, u)+ À hi (0 Ce, u)3 Hi (e)= Hi (a, ju (à 


(A) si 1, — 0 alors au moins pour une valeur de t, au moins un 
des vecteurs 1p (t), u (#), v (6), b® est non nul; 


(B)  p()=grad Hs: (e(9)+ À p5 (6 grad Wi(z (9) + 


+ù v; (é) grad wi (x à b), #4—0, 1,...,N, 


où l’on convient que 4% (0) = 0, HX+1 = 0; 
(C) Hi(x(t—1), u(t))= max H,(x(t—1), u), 


uEU (x(t- 1)) 


t—1,...,N; 
(D) v,()<0, vw Hwi(x(#)=0 pour tus les j=1, ..., pr: 
t—0, 1,...,N. 


Démonstration. Désignons par V; (x) l’ensemble de tous 
les points 


fe(x, u)=(fi(x, u), f(x, u), ..., fé (x, u)), 
qui s’obtient lorsque x parcourt l’ensemble U; (x). Les fonctions 
ff (x, u) étant continues et l’ensemble U;, (x) compact, l’ensemble 
V, (x) l’est aussi. En plus, par hypothèse, l’ensemble V; (x) est 
convexe. Enfin, V; (x) dépend d’une manière continue de x, puisque 
U; (x) dépend d’une manière continue de x, tandis que les fonctions 
ff (x, u) sont continues. Ainsi, les restrictions imposées dans le 
théorème 46.1 sur les ensembles V;, (x) sont satisfaites. 


27—01208 
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D'après le théorème 46.2, on peut obtenir certains résultats 
établis antérieurement par divers auteurs. Voyons, par exemple, 
comment on peut déduire le théorème appartenant à Halkin (voir 
la note **), page 80). Pour cela, supposons que nous avons l’objet 
(40.1), (42.1), ï.e. que les domaines de commande U; (x) = U; ne 
dépendent pas de x. Alors, pour les fonctions #; (x), on peut prendre 
X4 (x) = u (t) = const. En posant nr; — 0, nous obtenons la propo- 
sition suivante à partir du théorème 46.2. 

Théorème 46.3. Considérons l’objet commandé (40.1), (40.2), 
(40.5) pour lequel les domaines de commande ne dépendent pas de x 
(voir (42.1)) et sont compacts, tandis que l’ensemble V;, (x) de tous 
les points de la forme F (x, u), u € U}, est convexe pour tout x € Er. 
Supposons, en outre, que les fonctions f; (x, u) sont continues par rap- 
port au couple de variables x, u et possèdent des dérivées continues en x, 
tandis que les ensembles M}, t — 0, 1, ..., N, sont déterminés par 
les relations (46.19), (46.20). Soit (40.3), (40.4) un certain processus 
pour l'objet considéré qui satisfait aux restrictions x (t) € M+, t = 
0; di ON, 

Pour l’optimalité de ce processus (dans le sens du minimum de la 
jonctionnelle (40.5) avec les restrictions x (t) € M:), il est nécessaire 
qu'il existe un tel nombre 1, < 0 et de tels vecteurs 


d (6) = {bi (6), -.., Wa (6)}, = UNe 
u (£) = {11 (©), ..., Ur, (E)}; t=0, 1,...,N; 
VG)= {vu (), ..., Vn, ()}, t=0, 1,...,N, 

que l’on a les conditions suivantes (la fonction I}; (x, u) étant définie 


par la formule (42.2)): 
(A) si Yo — 0, alors, pour au moins une valeur de t, au moins un 


des vecteurs 4 (£), u (6), v (£) est non nul; 
Tf : 
(B) + G)= gradx Hess (x (6), u (£+-1)) + 2H (#) grad W? (x (#)) + 
2= 


P4 l 
“D v; (t)grad wi (x (é)), 1—=0,1,...,N, 
1 


où l’on convient que 4 (0) = 0, Hy1, = 0; 
(C)_ He(e(t—1), u(#)=maxÆHi(c(—1),u), t=1,...,N; 
ueU, 
(D) v;()<0, v;(G)uwi(x(t))=0 pour tous les j—1, ..., ps, 
=0, 14,...,N. 


Remarque 46.4 Supposons que tous les vecteurs 
grad Wi(x (#)), grad w;(x(t)) sont non nuls et désignons par Zi 
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l’hyperplan 
(&— 2 (#)) grad Wi (æ (#)) = 0, 


et par Qi le demi-espace 
(x — x (#)) grad wi (x (#)) 0. 


Supposons ensuite que pour tout { — 0,..., N le système de cônes 
convexes 


Là, Qi, PU), oi, ...,rs h=1,...,mu: jeJ:(x(0), (46.21) 


ne possède pas dans l’espace E" la propriété de séparation. Alors 
la condition (A) du théorème 46.2 peut être remplacée par la condi- 
tion suivante: 
(A”) si Yo — 0, alors, pour au moins une valeur de t, au moins 
un des vecteurs 4 (ft) est non nul. 
En effet, supposons qu’on a choisi le nombre 4, et les vecteurs 
1 (é), u (6), v (6), b b® qui satisfont aux conditions du FA 46.2 
k PR que Lois les nombres 46, Ya (4) (a "1 be 
=, , N) sont nuls. Alors, d’après la condition (A), au re 


un ds octours u (t), v(é), bŸ°, pour au moins une valeur de #, 
est non nul. Vu la condition (B), nous obtenons pour cette valeur 
de £: 


P} 


T4 . | 
à a (#) grad W (x (6) 2 Lo (£) grad w (x (é)) + > Dj —0 


(où les vecteurs du premier membre ne sont pas tous nuls), ce qui 
contredit, en vertu du théorème 32.2, au fait que le système de 
cônes convexes (46.21) ne possède pas dans Æ” Ia propriété de sépa- 
ration. 

Remarque 46.5. Si l’on considère le problème fonda- 
mental, i.e. si M, est tourné d’un seul point, tandis que les 
ensembles ,, ..., My cCoïncident avec tout l’espace E7, alors 
la relation (B) pour £{ — 0 dans le théorème 46.3 n’est plus néces- 
saire (voir la note, page 400), et pour { = 1, ..., NW, la relation 
(B) ne contiendra pas les fonctions W4 et wf. Autrement dit, dans 
le cas du problème fondamental les relations (B) et (C), indiquées 
ci-dessus, se transforment exactement en les relations (10.10), (10.12), 
(10.13). Ainsi, le théorème 46.3 (lorsqu'il n'y a pas de restrictions 
de phase) se transforme en le principe discret du maximum considéré 
dans le n° 10. 

Il faut ici remarquer que les théorèmes 46.1-46.3 contiennent 
l'hypothèse supplémentaire de convexité des ensembbes 
V, (x). Sans cette hypothèse supplémentaire, le principe discret du 
maximum énoncé dans le n° 10 est fau x: nous l’avons vu dans 


27* 
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l'exemple 10.3. Ainsi, les résultats contenus dans le présent para- 
graphe sont une variante correctement démontrée (et beaucoup 
plus générale) du principe discret du maximum énoncé sous forme 
d'hypothèse. 

Le théorème suivant montre de quelle manière on peut choisir 
les sections locales dans le cas où le domaine de commande U; (x) 
se détermine à l’aide de systèmes d'équations et d’inégalités. 

Théorème 46.6. Considérons l'objet commandé (40.1), (40.2) 
dans lequel le domaine de commande U; (x) se définit par les relations 
(45.1), (45.2) et soit (40.3), (40.4) un certain processus pour cet objet. 
ae a par T;(x(t—1), u(t)) l’ensemble de tous les nombres 
dl: 0 po lesquels on a l'égalité gi (x (t — 1), u (t)) = 0. 


Si Les . :, g sont régulières et le système de vecteurs 
rady Gi (r(t— 1), u(t , j—=1,...,k, 
g t ( G—1), u(£)) l (46.22) 
grady g,(t(£—1), u(t)), 1€ (x(—1), u(b)), 


linéairement indépendant, alors, pour l’objet considéré, il existe une 
section locale y; correspondant aux valeurs t, x (t — 1), u (t): 


4 (œG—1))=u(#, y (x) € Us (x). 


Démonstration. Désignons par /; le nombre d'éléments 
de l’ensemble 7, (x (£ — 1), w (t)) et considérons la matrice fonction- 
nelle 


9G} (x (t—1), u(t)) 0G} (c(t—1), u (t)) 
084 (x (t—1), u(t)) 084 (x (£—1), u (6) 
du! Lo our 


J=1,...,k; iCl;(x(t—1), u(t)), 
de k; + 1, lignes. Mais si les vecteurs (46.22) (ï.e. les lignes de cette 
matrice) sont linéairement indépendants, cette matrice est de rang 
k; + l;. Par conséquent, le système de relations 


À (x, u) = 0, j=1,...,k; gi(x, u)=0, 


ie Li(x(t—1), u (6), (46.23) 
est résoluble dans un voisinage des points x (£ — 1), u (t) relative- 
ment à certaines des variables u!, ..., u" au nombre de 


k,; + L;. Sans restreindre la généralité, on peut supposer que le 
système de relations (46.23) peut être résolu relativement aux pre- 
mières m variables ul, ...,u", où m — k,; + 1,. Autrement 
dit, il existe de telles fonctions régulières 


4 n m+1 r ne 
Press TU site 0), a= À, <.., M, 
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définies dans un certain voisinage des points x (f — 1), uw ({), que 
pr (xt (£— 1), ..., 2 (— 1), u*1(), ..., uG))=ut(, 
= À; :.:2, m0, (46.24) 
tandis que la substitution 
ut pr(xt, ...,a", uv, ..., uw), a=1,...,m (46.25) 
transforme les relations (46.25) en des identités relativement à 


1 n m +1 
Ds Re DS UN Sea as- ds 
Posons : 


(x) = pat, ..., a"; u*1(), ..., u'(t)), œ=1,...,m, 
XP(xz)=uP(#), B=mtt, 
Nous oblenons ainsi une fonction régulière 
du (c)= Qi), +, x (0), AT), +, x), 


définie dans un certain voisinage du point x (4 — 1). D’après (46.24) 
nous avons %z (x (£ — 1)) — u (#). 

En outre, comme la substitution (46.25) transforme les relations 
(46.23) en identités, nous obtenons 


Gi(z, KL (x) = 0, j—1, ..., ki; 
gi(z, (x) = 0, iCls(x(t— 1), u(t)). 
Enfin, pour ié Z; (x (t — 1), u (t)), nous avons 
gi (1), w(a(t—1)=g(a(t—1), u()<0 


et donc (en diminuant, s’il le faut, le voisinage du point x (t — {) 
dans lequel était définie la fonction %; (x)) on peut admettre que 
gi (x, + (x)) 0 où ié 1; (x ( — 1), u (t)) dans tout le domaine 
de définition de la fonction 7; (x). Ainsi, 


Gi(x, x (x))=0, j=1,...,k:; 
gi(x, X1(t)) KO, Led, -..s ts 


dans le domaine de définition de la fonction y; (x), i.e. %: (x) € 
€ Ur (x). 

Théorème 46.7. (principe du maximum). Con- 
sidérons l’objet commandé (40.1), (40.2), (40.5) pour lequel le domaine 
de commande U; (x) se détermine par les relations (45.1), (45.2), tout 
en étant compact, tandis que l’ensemble V, (x) de tous les points de la 
forme f; (x, u), u E U; (x) est convexe pour chaque x € ET. Désignons 
par T;(x, u) l’ensemble de tous les nombres i = 1, ..., q:, pour 
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lesquels on a l'égalité gi (x, u) = 0, et admettons que pour u € Ui (x) 
les vecteurs 


giady G} (tu), j=1,...,k; gradgi(x, u), 


iCl:(x, u), (46.26) 
sont linéairement ne Supposons, en outre, que les ensem- 
bles Ms, t — 0,1, ..., N, sont de la même forme que dans le théo- 


rème 46.2, les ne fi W}, wi étant toutes régulières. Soit (40.3), 
(40.4) un ‘certain processus pour l’objet considéré, satisfaisant aux res- 


trictions de phase x (1) E M;,t = 0,1,..., N, et soit PŸ Ja coupole 
de l’ensemble II au point x (t). 
Pour l’optimalité de ce processus (dans le sens du minimum de la 


fonctionnelle (40.5) avec les restrictions x (t) € M), il est nécessaire 
qu'il existe un tel nombre 1, < 0, de tels vecteurs 


() = {1 (6), -.., da ()}, t=1,...,N); 

ns 0 
= {vi (8), ..., V, (6)}, 0; lu, 
D), i—1,...,nm: t—0,1,...,N, 


et une telle r X n-matrice À (t), t — 1, ..., N, que la direction du 


vecteur b$° appartient (dans l’espace E") au cône dual D (P$) et les 
conditions suivantes sont satisfaites (la fonction H}; (x, u) étant défi- 
nie par la formule (42.2)): 

(A) si, — 0, alors pour au moins une valeur de t, au moins un des 


vecteurs Ab (£), a (£), v (6), b® est non nul: 
(B) 400 = grade Huu(e (Eu (+1) 4 


+ (gradu He, (x (t), u(E+ DA C++ D u; (£) grad W (x (t))+ 


+ S v; (#) grad wi (x (t)) — ÿ b°), t=0,; 1,24, 
ÿ=1 j—= 1 


où l'on a convenu que 4 (0) = 0; A y4, = 0; 


(C) Hi(x(t—1), u(t))—= max Hi(x(t—1),u),t—=1,...,N); 
UEU (xt 1)) 


(D) (4) <0, v;()uË(x(#)=0: j=1, ..., pe, 40,1, ..., N: 
(E) gradxgi(x(i—1), u(t)) +{gradu gi (x (t—1), u(#)) À (4) =0 
pour tous les i tels que gi(x (t — 1), u (9) —0 (—1,..., N); 
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(F) grad, G4 (x (£ — 1), u (9)+(grad, G (x (6 —1), u (#))) À (D = 
En PS ES RE UE Ne 

Démonstration. Comme pour u € U3 (x) le système des 
vecteurs (42.26) est linéairement indépendant, on peut en déduire 
que l’ensemble U}; (x) dépend de manière continue de x. En outre, 
il découle du théorème 46.6 que l’objet considéré possède des sections 
locales. Choisissons pour tout é — 1, ..., N une section locale #; 
qui correspond aux valeurs t, æ(t—1), u(t). Ainsi, on peut appli- 
quer le théorème 46.2. Introduisons la notation 


0%} (x (t—1)) 
Oz) 


i=AÀ,...,r3 j—=1,...,n; t—=1,...,N, 


— }j (6), (46.27) 


et désignons la r X n-matrice (Aj (#)) par A(#). Alors, d’après le 
théorème 46.2, il existe un tel nombre 1, < 0 et de tels vecteurs 


DC) = {hi (0), -.., Pa (0h =1,...,N; 
p(D={u(t), mn @  t=0, 4, ..., N: 
VE) = {Vi (6), ..., Vns (E)} t—0,1,...,N; 


D), i—1,...,1;: t—=0, 1,...,N, 


que la direction du vecteur D! appartient (dans l’espace Æ*) au 


cône D (Pf) et les conditions (A), (B), (C) et (D) du théorème 46.2 
sont satisfaites. En tenant compte de (46.27), on obtient les con- 
ditions (A), (B), (C), (D) du théorème 46.7. 


D'autre part, puisque %; (x) € U; (x), on a gi (x, 4 (x)) KO 
pour tous les à — 1, ..., g:. En outre, 


gi(x(é—1), w(x(t—1))=gi(x(t—1), u())= 
pour iCls;(xæ(t—1), u(£)). 


Par conséquent, pour à € I, (x (& — 1), u (t)) la fonction gi (x, % (x)) 
atteint son maximum au point x — x (t —1{) et, donc (voir (46.27)), 


og (x(t—1), u(t 
LG ef = + 


x=x(t— 4) 0x) 





7 ogi(x(t—1), u(t)) 
+ D XF (#) = 0, 


a—1 


j=1,...,n; iCl;(x(t—1), u(t)); trees in. 





Ce qui donne la condition (E) du théorème 46.7. 
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Enfin, si % (x) € Ur (x), on a Gi (x, 43 (x)) = 0 pour tous les 
] = 1, se 85 k:, et 


DS GT (x(t—1), u (6) 
_ G(æ, 4 (&)) 0 
0x! x=x(t1) Oxt 





_ 26 (x(t—1), ut), 


+ Er" nn ÿ (= 0, 


1—=1,...,n;  . t—1,...,N. 
Ce qui donne la condition (F) du théorème 46.7. 
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47. Objets à domaine de commande constant. Pour obtenir des 
conditions suffisantes d’optimalité, nous appliquerons les résultats 
du n° 37. Dans ce contexte, il sera nécessaire d'imposer certaines 
restrictions sur l’objet commandé, qui correspondent aux conditions 
indiquées dans le n° 37. 

Notons avant tout que l’ensemble Q” se détermine dans le théo- 
rème 37.7 par des équations linéaires. Nous nous limiterons 
donc ici à l’étude des objets discrets commandés linéaires en 
x et u. Autrement dit, les équations (40.1) prennent maintenant la 
forme 


(D = ci (é)at(t—-1)+... + (bat (é—1) + 


+ dit) ut (6) +... + dr (tu (t +ei(#, 
i=1,...,n, t—1,...,N. (47.1) 


D'autre part, la condition (37.1) imposée sur la fonction FÆ (2) 
s'écrit sous la forme suivante (comparer à (37.2)): 


fi(x, u)Zf(x(—1), u()+(x—z(t—1)) grads fi (x (t—1), u (#))+ 
L(u—ut(t))grad, fi(x(t—1), u(t)), t—=1,...,N. (47.2) 


En particulier, la condition (47.2) sera satisfaite si pour tout { — 
— 1,..., N la fonction E (x, u) est convexe (dans l’espace 
de toutes les variables x! Loue de do: : W): 

Remarquons que la condition (47.2) a été formulée pour le pro- 
blème du minimum de la fonctionnelle (40.5). Dans le cas du 
problème du maximum de cette fonctionnelle, il faut changer le 
sens de l’inégalité dans la condition (47.2) (en particulier, cette 
condition sera satisfaite si les fonctions f? (x, u), t — 1, ..., N, 
sont concaves). D'ailleurs, le problème du maximum de la 
fonctionnelle J (voir (40.5)) peut toujours être remplacé par le 
problème du minimum de la fonctionnelle —J. 
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Les conditions que nous imposerons sur les ensembles U; (4 — 
= 1,..., Net M,(Tt = 0,1,..., N) sont analogues aux con- 
ditions (b), (c), (d) du n° 37) (page 333); elles seront inclues 
dans l'énoncé du théorème. 

Théorème 47.1. Soit (40.3), (40.4) un certain processus de 
l’objet discret commandé (47.1), (42.1) et supposons que l’on a les in- 
clusions x () E M;,t — 0,1, ..., N. Supposons, en outre, que pour 


chaque t — 1, ..., N l’ensemble U; est de la forme 
l 
Qu fb. :( Qi? AE ED fl 4 ie En 
tandis que l’ensemble M, pour tout = 0, ñ ..., N'est de la forme 


(nr) (54) 


M;.=1n... NH AZ N... NX: 
où Q®). a) sont certains ensembles de l’espace des variables u*, 


, u'et 1, De certains ensembles de l’espace des variables Le 1, 
..., x". Soientenfin K? la coupole de ljensemble Q au point u (t); 
LŸ® la coupole de l’ensemble EŸ au point u(t): PŸ la coupole de 


l’ensemble ILŸ au point x (x) et Q0Ÿ la coupole de l’ensemble 39 à 
point x (t). Nous supposerons que l’on a les inclusions 


QP _ KS Cid _ LŸ T1Ÿ — PA > œ 0%) 

—_ 9 
(pour tous les i, j, t, t). Enfin, supposons que les fonctions f? (x, u) 
qui figurent dans la définition de la fonctionnelle (40.5) satisfont à la 
condition (47.2) (en particulier, cette condition est satisfaite si les 
fonctions f} (x, u) sont convexes). 


Pour l'optimalité du processus (40.3), (40.4) (dans le sens du mini- 
mum de la fonctionnelle (40.5) avec les restrictions x (t) € M}, t — 


— 0,1, ..., N), il suffit qu'il existe un tel nombre 1, << 0 et de tels 
vecteurs 
(6) = {ba (6), + Pr (0), =1,...,N: 
af, i=4, ...,4l; t=14,...,N; 
9 j—1, LA r—0, 1,...,N, 


que la direction du vecteur af” appartient au cône dual D (K$), La: 
direction du vecteur bŸ appartient au cône dual D (PO) et l’on a les 
conditions suivantes (A) et (B), dans lesquelles figure la fonction 
H}; (x, u), définie par l'égalité 


Hi (a, u)= of (e, u)+ 2 vi x 


X (2 ci ()2t + à dé (4) u% + ef (+)) : 


-426 CRITÈRES D’OPTIMALITÉ DES PROCESSUS DISCRETS [CH. V 


(A) pour tout t — 0, 1, ..., N et pour tout vecteur x dont la 
direction appartient à l'intersection des cônes 09) Éd ss) 
on à l'inégalité 

: 


>, b{") Ôx<O0, 


i—1 


(— 14 (6) + grads Hi (x (6), u(+1)) 


où l’on convient que 4 (0) = 0, A y41 = 0; 

(B) pour tout t = 1, ..., N et pour tout vecteur ôu, dont la direc- 
tion appartient à l'intersection des cônes L® =, 5:22, 1), On: 
Ll’inégalité 

l 


(grad, H;(x(t—1), u(6)) _s: af) ou<0. 


Démonstration. La substitution (42.6) ramène le pro- 
blème de commande optimale considéré au problème du minimum 
-de la fonction 


F9 (2) = fi (to, Us) + fe (dus Uo) + + fN (Zn UN) 


-sur l’ensemble Z* qui se définit par le système d’égalités 


Fi(z)= — 24 ci (t)ai a... ché) dia + 
+d@ui+...+d(tuite()=0 (47.3) 
‘et le système d’inclusions 
He Ur De CMS PET, sus NE = OL is Ne 
Pour résoudre le problème du minimum de la fonction Æ° (z) sur 
l’ensemble Y*, on peut appliquer directement le théorème 37.7 


(en y posant r — 0, p — q — 0) et la remarque 37.8. La condition 
(B) du théorème 37.7 prend alors la forme suivante: 


N n NN 
àX( Vo gradx,À° (20) F2 2 v? gradz,Fy (&)) ÔX; 
N n  N 
+ 2 ChograduF (2) + 2 2 Ve graduFs (20)) Bt — 


N le N + , 
— Y Dabu,.—Y À box <0 
i t=0 j—=1 


T—=1 i=1 


pour tout vecteur ô2 — {ôx;, Ôu.} qui possède la propriété sui- 
vante: la direction du vecteur ôx; appartient à l'intersection des 


-Cônes of),  …. Qi? (6 — 0, 1,..., N) et la direction du vec- 
: Ur : À (m.) 
teur Êu., appartient à l’intersection des cônes LD LR (t— 
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= 1,..., N); ici on a désigné par z, le point qui correspond au 
processus (40.3), (40.4) d’après la substitution (42.6). 

Soit Ôz — {ô%:, Ôu.} un vecteur qui satisfait aux conditions 
indiquées, i.e. possède la propriété suivante: la direction Fi vec- 


teur x; appartient à l’intersection des cônes 09, .. , Of? = = 
= 0,1, ..., N) et celle du vecteur ôuw, à l'intersection des cônes 
Lo. ET (x — 1,..., N). Alors Ôô2 peut être mis sous 
la forme 


N n 
de = D 629 + 1 52%), 
1 


t—0 T—= 


où le vecteur 84% possède la même composante 8x9 que le vecteur 
ô2 et les autres Re ôx:, du. du vecteur 62% sont nulles et, 
d’une manière analogue, le vecteur 624% possède la même compo- 
sante Ôu, que le vecteur ô+, tandis que les autres composantes ôx;, 
Ôu.- du vecteur ô2$" sont nulles. Si nous montrons que pour chaque 
vecteur 62, 2% (4 — 0, 1,...,N; T—1,..., N) on a la 
condition (B) écrite ci-dessus, on peut, en calculant la somme, véri- 
fier que cette condition est valable pour le vecteur Ôz, ce qu’il fallait 
démontrer. 

Mais l’on vérifie aisément (vu la forme des fonctions F9 et Fi), 
que la condition (B) coïncide avec la condition (A) du théo- 
rème 47.1 pour le vecteur ô2$* (il suffit d'appliquer la substitution 
(42. 6) et poser Wi = 1}; (t)). Ainsi, lorsque la condition (A) du théo- 
rème 47.1 est remplie, le vecteur 62° satisfait à la condition (6). 

D'une manière analogue, la condition (6) pour le vecteur 84” 
coïncide avec la condition (B) du théorème 47.1. 


Remarque 47.2. Désignons par À l’ensemble de tous les 
points z— (x, u}) qui satisfont à la condition wo € KŸ : d'une 
manière analogue, eos les ensembles L®, P9, Of) les 
inclusions ue € LŸ, xe € PŸ, xe E QŸ. Enfin, désignons par À: 
l'hyperplan (de l’espace E* de toutes les variables x}, ui) défini 


par l'équation Fi — 0 (voir (47.3)). Si le système des cônes convexes 
K°° LS. Pÿ, Of, RŸ (47.4) 
(pour tous les i, t) ne possède pas dans l’espace E* la propriété de sépa- 
ration, alors les conditions indiquées dans le théorème 47.1 sont néces- 
saires et suffisantes pour l'optimalité du processus (40.3), (40.4). Ceci 
découle immédiatement du théorème 37.7. 
Néanmoins, la condition selon laquelle le système de cônes 
(47.3) ne possède pas la propriété de séparation est difficile à véri- 
fier. Mais si cette condition n'est pas satisfaite, la condition suf- 
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fisante indiquée dans le théorème 47.1 cesse d’être nécessaire: une: 
condition nécessaire assez proche est contenue dans le théorème 43.5. 
En estimant dans le théorème 47.1 que certains des ensembles 
QŸ sont des hyperplans, certains sont convexes (KŸ étant alors 
le cône d'appui), tandis que d’autres sont déterminés par :des res- 
trictions convexes (comparer aux conditions (c’), (c’ 7, (c'"), pa- 
ge 3936), et que les mêmes hypothèses sont vraies pour les en- 
sembles E%, I, 5%, nous pouvons alors obtenir plusieurs théo- 
rèmes à partir du théorème 47.1. Enonçons un de ces théorèmes, 
qui s'obtient lorsque les ensembles IIŸ sont déterminés par des 
équations linéaires et des restrictions convexes, les ensembles U, 
sont convexes, tandis que les ensembles Z{° sont absents. 
Théorème 47.3. Soit (40.3), (40.4) un certain processus pour 
l’objet discret commandé (47.1), (42.1), les inclusions x (f) € M, 1 — 


— 0, 1, ..., N étant satisfaites. Supposons, d'autre part, que pour 
tout T = 1, ..., N l’ensemble U, est convete, tandis que pour tout 
t—0,1,..., N l'ensemble M}; se détermine par le système de rela- 
lions 
Wiat, ...,2")=0, i=1,...,7:; (47.5) 
(D ses DT), Jets De (47.6) 


où les W; sont des fonctions affines non constantes, et les wi des fonc- 
tions convexes régulières. Supposons enfin que les fonctions fi (x, u} 
qui figurent dans la définition de la fonctionnelle (40.5) sont convexes. 

Pour l’optimalité du processus (40.3), (40.4) (dans le sens du mi- 
nimum de la fonctionnelle (40.5) avec les restrictions x (t) € M3, t = 0, 
4, ..., N), il suffit qu'il existe un tel nombre 1%, < 0 et de tels vec- 
teurs 


Dei) SO Met sn 
(é) = {lu (), ss Ur, (6)}, D 0, Lisseur 
={vi(), ...,vn,(0)}, = 0,1,...,N, 


que tous les nombres v; (t) sont non positifs et les conditions suivantes 
sont satisfaites (la fonction H}; (x, u) étant la même que dans le théo- 
rème 41.1): 


(A) ne H,:1 (x (6), bib (é) + 


+ D u; (£) grad W; (x (t)) + D (£) grad 7 (x (£)) — 
10; ss NS 


où l’on convient que 1 (0) — 0, H y41 = 0; 
(B) pour tout t — 1, ..., N et, pour tout vecteur du dont la direc- 
tion appartient au cône d'appui de l’ensemble U; au point u (t),on a 
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l'inégalité 
du grad, H3 (x (t — 1), u (t)) L O0 
(EC) Mo GE, a=t,.r.;mr 1=0; Las 


Démonstration. Prenons chacun des hyperplans (47.9) 
el chaque ensemble déterminé par une des restrictions (47.6) pour 
les ensembles IIS qui figurent dans le théorème 47.1. Ensuite, pour 
chacun des ensembles II (ils sont tous convexes) prenons Done p 
le cône d'appui de l’ensemble TH au point x (#). Ainsi, si IS est 
un des hyperplans (47.5), alors le vecteur b®, dont la direction 
appartient au cône D (PŸ), est de la forme —u;(f) grad Wi(x(t)) 
où u;({) est un scalaire. D'autre part, si l’ensemble 119) 
est déterminé par une des restrictions (47.6), où wi (x (#)) = 0, 
alors le vecteur bŸ est de la forme —w; (6) grad u? (æ (t)), où wv; & < 
< 0. Enfin, si wi (x (t)) < 0, alors D (PŸ)) est un point et donc 
po — 0, ie. 069 — —w;, (# grad wi(x (#)), où v; (t) = 0. Il reste 
à appliquer le théorème 47. 

Le cas particulier suivant du théorème 47.1 se rapportant au 
problème fondamental (i.e. au problème à état ini- 
tial fixe x (0) — x,, sans restriction de phases) est intéressant, car 
il donne une condition nécessaire et suffisante d’'optimalité. 

Théorème 47.4. Soit (40.3), (40.4) un certain processus à 
état initial x (0) — x, pour l’objet discret commandé (47.1), (42.1). 
Supposons, d'autre part, que pour tout t — 1,..., N l’ensemble U; 
est convexe. Admettons que les fonctions f4 (x, u) qui figurent dans la 
définition de la fonctionnelle (40.5) satisfont à la condition (47.2) 
(en particulier, cette condition est satisfaite si les fonctions fi (x, u) 
sont convexes). 

Pour l’optimalité du processus (40.3), (40.4) (dans le sens du mini- 
mum de la fonctionnelle (40.5) avec état initial fixe x (0) — x,, sans 
restrictions sur les états x (t), t —1, ..., N) il est nécessaire et suf- 
fisant qu’il existe un tel nombre 1, << 0 et de tels vecteurs 


— {V1 (6), - . …, Yn ()} t—1,..., N, 


que les conditions suivantes sont satisfaites (la fonction H; (x, u) étant 
la même que dans le théorème 47.1): 

(A) D = grads Hin(e(, u(G+1), #1, ..., N, où 
l’on a convenu que H +1 = 0; 

(B) pour tout t — 1, N et pour tout vecteur ôu dont la direc- 
tion appartient au cône d'appui L; de l’ensemble U au point u (t), 
on a l'inégalité 


du grad, Hs (x (t — 1), u (t)) LO0 
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Démonstration. La suffisance des conditions énoncées 
découle immédiatement [du théorème 47.1. Pour démontrer leur 
nécessité, il s’uffit d'établir, d’après laremarque47.2, que le système 
de cônes convexes 


Li, Ri (47.7) 
ne possède pas dans l’espace Æ* des variables æi, ui (i —1, ... 
one Je li a Me ss Nes ess NN) de 


propriété de séparation. 
Désignons par D4 (8 — 1, ..., N) l’ensemble de tous les points 
z — (x;, u.) de l’espace E*Ÿ qui satisfont aux conditions 


,æ = æ(t) pour tous les £ = 4, ..., N, u, — u (x) pour T0 


(«9 est arbitraire). D'autre part, désignons par D l’ensemble de 
tous les points z — (x;, u.,) qui satisfont à la condition u9 = u (0) 
(x; et u. pour t = 6 étant quelconques). Alors D, N D$ est le point Z& 
(qui correspond au processus (40.3), (40.4) d’après la substitution 
(42.6)). Choisissant z, pour point origine de l’espace E*, nous voyons 
que D et DS sont des sous-espaces de l’espace vectoriel E*, et 


E* = D, @ Dé. Remarquons aussi que L4 = D# (4 — 1, ..., N). 
Il est aisé de voir que le système des sous-espaces 
Ri, Df,i=1,...,n; t—14,...,N, (47.8) 


ne possède pas dans Æ* la propriété de séparation. En effet, i'hyper- 
plan R; est défini par l'équation F3 (2) = 0 (voir (47.3)), tandis que 
l’espace D? est de la forme Df = DifN.../fN D#, où l’hyperplan D; 
se détermine par l’équation 

uy= ui (#). (47.9) 
Enumérons maintenant toutes les variables x;, u£ dans l’ordre sui- 
vant : 

A PT 


1 n 1 n 1 n 
Lis ses Lo L9, eee LI ce Ns es AN° 
Alors la matrice formée des coefficients des inconnues dans les rela- 
tions (47.9), (47.3) sera triangulaire et la diagonale principale est 
formée des nombres +1. Par conséquent, le déterminant de cette 
matrice est non nul, et donc le système d’hyperplans R;, Di ne pos- 
sède pas dans Æ* la propriété de séparation. 

Mais alors le système de sous-espaces (47.8) ne possède pas, non 
plus, cette propriété. A fortiori, le système de cônes (47.7) (car 
Li = Df) ne peut pas posséder cette propriété. 

Remarque 47.5. On voit que la condition (B) du théorème 
47.4 peut être écrite de la manière équivalente ci-dessous: 


(B) ÆH(rx(—1), u(6))= De H(x(t—1), u), t1=1,...,N. 
uEU; 
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En effet, si ÿ, << 0, la fonction A3 (x (4 — 1), u) d'après (47.2) 
possède la propriété suivante: 
H;(x(t—1),u) LH;(x(t —1), u(i)) + 
+ (u — u ()) grad, H3(x (t — 1), u ()). 


D'après la condition (B) du théorème 47.4, on peut déduire que la 
fonction H; (x (£ — 1), u) de la variable w, restreinte au cône d’ap- 
pui L;de l’ensemble U;,, atteint son maximum au point uw = u (t). 
A fortiori, cette fonction restreinte à l’ensemble U;, € L;, atteint 
au point u — u (f) Ce même maximum, i.e. on a la condition (B”). 
Réciproquement, la condition (B”) implique la condition (B) d’une 
manière évidente. 

Remarque 47.6. Le théorème 47.4 peut être également obte- 
nu comme corollaire du théorème 38.2. En effet, la substitution 
(42.6) réduit le problème de commande optimale considéré au pro- 
blème du minimum dela fonction Æ° (z), restreinte à l’ensemble ZX 
défini par les équations linéaires F3 (z) — 0 (voir (47.3)) et les in- 
clusions u; € U}, les ensembles U}, étant convexes. En appliquant 
le théorème 38.2 (ce qui est admissible, le système de cônes (47.7) 
ne possédant pas dans Æ* la propriété de séparation), nous obtenons 
l’assertion suivante. 

Pour que la fonction F (2), restreinte à l’ensemble ©, atteigne 
son minimum au point Zo, il est nécessaire et suffisant qu'il existe de: 
tels nombres 5 < 0 et Yi —1,...,n; t—1,..., N) que la 
fonction 


N n | 
H()= br ()+ 2 2 WiFi (e), (47.10) 


considérée pour toutes les valeurs de x, et pour u; € U;, atteigne son 
maximum au point Zo-. 

Si la fonction (47.10) atteint son maximum au point Z,, alors 
grad+, # (9) = 0 (ce qui donne la condition (A) du théorème 47.4} 
et l’on a la condition (B”). 


Inversement, .si les conditions (A) et (B) du théorème 47.4 sont 
satisfaites, alors la fonction affine 


N n | 
D (2) = o (2— 20) grad PF (z) Rèà 2 WiFi (z) = 
N 


= Vo À Gers (19) gradaf? (1), u (9) + 


N 
+ ob À (us — u (t)) gradufs (x (£—1), u (#)) + 
N n 


N n . | 
F2 AVR 2 2 WF 6) 
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ne dépend pas (d’après la condition (A)) des variables x? et donc 
(d’après la condition (B)) atteint, pour u; € U;, son maximum (égal 
à 0) au point z,. Comme d’après (47.2) 

H (2) < H (x) + D (2), 


on à H (z) LH (%), i.e. la fonction (47.10) atteint Son maximum 
au point Zo. 

Pour conclure, considérons encore le cas où les équations (40.1), 
qui déterminent l’objet discret commandé ne sont ni linéaires, ni 
Convexes. 

Théorème 47.7. Soit (40.3), (40.4) un certain processus pour 
l’objet discret commandé (40.1), (42.1) et l’on a les inclusions x (t) € 
€ M:,t—=0,1,..., N. Supposons que toutes les fonctions f; (x, u) 
(qui apparaissent dans les deuxièmes membres des relations (40.1) 
sont convexes relativement à toutes les variables xt, ..., x", ul, .. 

., uw’. Supposons en outre que les ensembles U; et M, sont de la 
même forme que dans le théorème 47.1, tandis que les fonctions fi (x, u) 
satisfont à la condition (47.2) (en particulier, cette condition est satis- 
faite lorsque les fonctions f? (x, u) sont convexes). 

Pour l'optimalité du processus (40.3), (40.4) (dans le sens du mini- 
mum de la fonctionnelle (40.5) avec les restrictions x (t) € M3, t = 0, 
4, ..., N), il suffit qu'il existe un tel nombre 1, << 0 et de tels vec- 


teurs 
bites VO tb. N; 
af, i—1,...,k; t=1,...,N: 
b°) j=1,..., 7x; tT—=0,1,...4, 


que la direction du vecteur a? appartient au cône dual D (KS)), la 
direction du vecteur b® appartient au cône dual D (P9) et l'ona 
les conditions suivantes (la fonction H};(x, u) étant définie par la 
formule (42.2)): 

(A) pour tout t — 0, 1, ..., N et tout vecteur Ôx, dont la direc- 


tion appartient à l'intersection des cônes Qf), on a l'inégalité 


n} | 
(D) +gradelen (zu (+1) 201) 8x <0, 


où l’on convient que 1% (0) = 0, Hxy+1 = 0; 
(B) pour tout t —1,..., Net tout vecteur Ôu — {ôu!, 


* 


, Ôu'} dont la direction appartient à l'intersection des cônes 


L® (i =1,..., nu), on a l'inégalité 
l 


(grad, H4(x(t—1), u(t))— D af”) Su<0; 
11 
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(C) WE, i=1,..,n; 1=1,..,N. 
Démonstration. Désignons par W4 l’ensemble de tous 
les points z — (x, ui) qui satisfont à la condition 


Fi(z)= fi (tt, w)—i<0. 


Comme f} est une fonction convexe, l’ensemble W2 est convexe. 
Si Z est le point qui correspond au processus (40.3), (40. 4) d° après 
la substitution (42.6), alors le‘point z, est situé sur lafrontière 


de l’ensemble W; (comparer à (40.1)), et le cône d'appui de l’en- 
semble convexe W{ au point z, sera le demi- -espace 


(z— 20) grad, F | (20) KO. 


La substitution (42.6) réduit notre problème à la recherche du 
minimum de la fonction Æ° (z) sur l’ensemble déterminé par le sys- 
tème d’inclusions 


2€ W:, ur EU, 2 EM, ll, san: 
1—=1,...,N; 7=0,1,...,N. 


Pour résoudre ce problème, on peut appliquer le théorème 37.5 et la 
remarque 937.6. La condition (6) du théorème 37.5 prend alors la 
forme suivante: 


N N 
D (ograds, Fe (20)) 8a+ D} (io gradu, Fe (G0)) Bar — 


N OT. N n 
— ÿ > au — >, D bou D, > ef8:<0 
1=—0 j—=1 t=1 i—1 


ti i=1 
pour tout vecteur 
Ôz — {ôX:, Ôu:)} 
qui possède la propriété suivante: la direction du vecteur ôx; ap- 


RS à l’intersection des cônes 0), ut Oi* = 0, À 
, N), tandis que celle du vecteur ôu, à l’intersection des cônes 
(D us Le (rt, 4. NN) EC a” est un vecteur dont la 
direction appartient au cône dual D (KŸ); d'autre part, 6 est 


un vecteur dont la direction appartient au cône dual D (P9) : enfin, 
c® est un vecteur dont la direction appartient au cône dual au demi- 


espace 
(z — 29) grad, Fi (20) KO, 
28—01208 
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CE = — 1h; (+) grad:F3 (20), 
où W; (£) LO. On termine maintenant la démonstration exactement 
comme dans le théorème 47.1. 

48. Obiets à domaine de commande variable. Nous allons consi- 
dérer les objets (47.1), (40.2) pour lesquels le domaine de commande 
U; (x), pour tout 

DL, Lun DÉS 
est donné par le système d’égalités et d’inégalités (45.1), (45. 2)s 
où les fonctions G@ seront supposées affines et les fonctions g; con- 
vexes. En ce qui concerne les fonctions /f et les ensembles A7,, nous 
utiliserons les hypothèses du sous-paragraphe précédent. Nous ob- 
tiendrons alors le théorème suivant: 

Théorème 48.1. Considérons l’objet commandé (47.1), (40.2), 
où l'ensemble U;(x), pour tout x — (xt, ..., x") € E" donné, se 
détermine par le système de relations (45.1), (5. 9) dans lesquelles les 
fonctions G% sont affines et les fonctions g; sont convexes. Soit (40.3). 
(40.4) un certain processus de l’objet considéré qui satisfait aux inclusions 


x ()EM;, t = 0, 12 “5 SS N, 


où M, est un ensemble de l’espace E" des variables x,, . .., x" de 
La forme 

A RE > à 
Supposons que pour chaque t = 0, 1, ..., N on se donne dans E 
des cônes convexes PŸ, Q0® (ls Le He Tete Dos 


sédant les sommets x (x), ces cônes sont les coupoles des ensembles cor- 
respondants TI 2%) et l'on a les inclusions 


110) _ PŸ > _ Q®. 
Supposons enfin que les fonctions fi (x, u) qui figurent dans la défji- 
nition de la fonctionnelle (40.5) satisfont à la condition (47.2) (en 
particulier, cette condition est satisfaite si les fonctions f? (x, u) sont 


convexes). 
Pour l’optimalité du processus (40.3), (40.4), dans le sens du mini- 


mum de la fonctionnelle (40.5) avec les restrictions 
LT EMs, E=0, L.:24.Ns 
il suffit qu'il existe un tel nombre 1, << 0 ei de tels vecteurs 
(é) = {bi (€), ..., P, (6)}, REA PR | 
= {pi (0), -.., Pr, (O)}, t—1,...,N; 
À (6) = {A (0), - -., Aa, (6)}; LT, sise NN à 
p$), RSS RS D _ t=0,1,...,N, 
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que la direction du vecteur bŸ appartient au cône D (P9) et l’on a 
les conditions (A)-(C) ci-dessous dans lesquelles figure la fonction 
I; (x, u) définie par l'égalité 


Hi (x, u) = bof? (x, u)+ 2 Vi (€) X 
«(Béoe+faoe+s0): 
k; q 


+ 21 Pa (6) GE (&, u)+ 2 ha (85 (eu) : 


(A) pour tout t — 0, 1, ..., N et tout vecteur Ôx, dont la direc- 


* 


tion appartient à l'intersection des cônes QG —=1,..., St), on 
a l'inégalité 
ny 


(—1p (6) +grad,.H,,4 (x (8), u(t4+1)) - jo b9)) 6x <0, 


où l’on a convenu que 4 (0) — 0, F4, = 0; 
ee Hi GT), GO) ==... ss 
(C) Au (9 SO, Aa () 88 (x (E — 1), u (#) = 0, 

DS un dote LL N 


Démonstration. La substitution (42.6) ramène le pro- 
blème de commande optimale considéré au problème du minimum 
de la fonction FÆ° (z) (voir (42.3)) sur l’ensemble Z* déterminé par 
le système d’égalités (47.3), (45.1), le système de restrictions (45.2) 
et le système d’inclusions 


tt E M, (é="0), 1, . N). 


Pour résoudre ce problème du minimum de la fonction Æ° (z) sur 
l'ensemble Z* on peut appliquer directement le théorème 37.7 
et la remarque 37.6. La condition (6) du théorème 37.7 prend ici 
la forme suivante: 


n oo - 
> | Po gradx,F° (36) F2 2 Pa gradx F'; (2) ) Ôx, 


N n  N 
+ D (ogradu F0 (es) + D D 42 gradu F5 (20) Bux + 
tr a=1 = 
N NN ky 
+ D 2 2 qa(ôx: grads G% (20) + 
10 y=1i a=i 


1} 4 
2 


+) 2 : pa (ôu. gradu, Gy (0) + 


Ivy 1.1 
28* 
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N 


+ 2 2: DE à (Ôx: grad. & (2o)) + 
N 7 | 
Æ D à à 2 AB (OU. grady _& (Zo)) — 2 | 21 at 6x: <O 
NV t=0 3— 


pour tout vecteur ô? — de Ôu.} qui possède la propriété suivante: 
la direction du vecteur ôx; appartient à l'intersection des cônes 


1 (s,) 
Q$,..., Qt (t—=0,1,...,N): 
ici Z, désigne le point qui correspond au processus considéré (40.3), 
(40.4) d’après la substitution (42.6). Remarquons aussi que dans 
la condition ci-dessus la sommation sur l'indice $ s'effectue sur tous 
les nombres j = 1, ..., qg, pour lesquels 87, (29) = 0; néanmoins, 
si l’on pose le nombre À} égal à O0 pour toute valeur de j, on peut 
supposer que la sommation sur f s'effectue de 1 jusqu’à g, et l’on a 


SO,  AlgŸ (20) = 0 
pour tous les f, ». 


On termine maintenant la démonstration exactement comme 
celle du théorème 47.1. 

Remarque 48.2. En comparant le théorème démontré avec 
le théorème 45.1, nous voyons que la condition suffisante d'opti- 
malité contenue dans le théorème 48.1 est très proche des conditions 
nécessaires. Pour déterminer une situation dans laquelle les con- 
ditions indiquées au théorème 48.1 sont nécessaires et suffisantes, 
il faut raisonner comme dans la remarque 47.2. 

À savoir, désignons par PS l’ensemble de tous les points z — 
= (z}, u?) quil satisfont à l'inclusion ze € PŸ): d’une manière 
analogue désignons par O$ l’ensemble correspondant à l'inclusion 
ze EQŸ. D’ autre part, désignons par R1 l’ensemble de tous les 


points z — (x, uw) qui satisfont à la condition 
(trs x(t—1)) grade gi (x (6—1), u ()+ 
+ (a —u (t)) grad, gi (x (t—1), u (f)) LO. 
Enfin, désignons par Si et Ti les hyperplans respectifs déterminés 
par les équations 
Gi (ti, Us) = 0, Fi=0 
{voir (45.1), (47.3)). 


Si le système de cônes convexes 


AD Ai î î 1 
P; , 2 R;, to T'; 
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(pour tous les i, t) ne possède pe la propriété de séparation dans l'es 


pace de toutes les variables x, u?, alors les conditions énoncées dans 
le théorème 48.1 sont nécessaires et suffisantes pour l’optimalité du 

processus (40.3), (40.4). Ceci découle immédiatement du théorème 
7.7. 


Remarque 48.3. D’après le théorème 48.1 on peut sup- 


poser que certains des ensembles II® sont des hyperplans, certains 
sont déterminés par les inégalités de la forme 


p©) 
. <0, 
où © est une fonction convexe, d’autres ensembles II sont 
Convexes et pour PŸ on choisit le cône d'appui correspondant. Il en 


est de même des ensembles ZX. En définitive, on peut obtenir, 
d’après le théorème 48.1, un théorème plus général et en déduire 
toute une série de cas particuliers. Nous ne les citons pas ici. 


APPENDICE 1 


PRINCIPE DU MAXIMUM POUR LES SYSTÈMES 
À TEMPS CONTINU 


Dans le chapitre I (page 67-68), nous avons énoncé le principe du 
maximum de L. Pontriaguine, qui est une condition nécessaire 
d'optimalité pour les objets commandés à temps continu. Ici, à l’aide 
des méthodes développées dans le présent ouvrage (i. e. la méthode 
des coupoles), nous donnons une démonstration du théo- 
rème indiqué. 

Avant tout, énonçons à nouveau (sous une forme plus générale 
qu’à la page 52) la position du problème. 

Nous allons considérer l’objet commandé 


PTE U); u EU, (1.1) 
où x — (2°, xl, ..., x") est le vecteur caractérisant l’état, u — 
= (ul, ..., u”) le vecteur de commande. Dans l’espace R7*t (l’es- 


pace des phases), choisissons deux variétés A7, et M,. Le problème 
de commande optimale consiste à trouver un processus uw (#), x (#6), 
lo LL, à Commande continue par morceaux u (t) qui satisfait à 
l'équation (1.1) et aux conditions aux extrémités 


T (Lo) È Mo; T (41) È M, (1.2) 


et qui possède, en outre, la propriété ci-dessus: pour ces conditions 
la coordonnée x° du point extrême x (£,) prend une valeur minimale 
(les moments {,etisne sont pas donnés d’avance). 
Désignons par Q, le domaine d’atteignabilité, i.e. l’ensemble de 
tous les points de l’espace R"*1 que l’on peut atteindre en commen- 
çant le mouvement à partir d'un point quelconque de la variété M, 
et en se déplaçant suivant la loi (1.1). Autrement dit, le point x; 
appartient à l’ensemble Q, s’il existe un point x, € M, et une com- 
mande u (t), té, tt, qui satisfait à l’inclusion uw (#) € U (quel 
que soit t), tels que la solution x (4) de l'équation x = f (x, u (£)) à 
condition initiale x (fo) — x, passe par le point x, au moment f,. 
Supposons maintenant que u (#), x (t), to St Lt, est un pro- 
cessus optimal. Désignons par Q, l’ensemble qui contient le 
point x (4) et tous les points x — (x°, x!, ..., x”) pour lesquels 
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x x (t,). Enfin, posons Q, = M,. Il est aisé de voir que l’in- 
tersection 


Q, N G AN (1.5) 


consiste en un seul point x (£,). En effet, s’il existait un point x* — 
— x (4) appartenant à l’ensemble (1.3) on pourrait trouver un pro- 
cessus u* (4), x* (1), tÿ Lt Ltf, satisfaisant aux conditions z* (#4) € 
E Mo, x* (t*) — x* E M,. En outre, l'inclusion x* € Q, implique- 
rait que la coordonnée zx° du point x* (ff) est plus petite 
que celle du point x (é,). Mais cela est en contradiction avec l’opti- 
malité du processus u (£), x (#), ty Lt Lt,. Ainsi, pour obtenir 
l’optimalité, il est nécessaire que l’intersection (1.3) contienne uni- 
quement le point x (#4). 

Construisons maintenant le cône d'atteignabilité 
K,. Soit t, 4, T< 14, un moment quin’est pas un point de discon- 
tinuité de la commande (tf).Chaque vecteur de la forme f (x (t),v)— 
— f(x(r), u(r)), où vEU, sera appelé vecteur de saut au mo- 
ment T. 

Ensuite, convenons d'appeler la fonction & (4) à valeurs dans 
R"*# variation admissible, si elle possède les trois propriétés sui- 
vantes: 

1) le vecteur Ë (4,) est tangent à la variété 7, au point x (£;); 

2) la fonction Ë ({) possède un nombre fini de discontinuités du 
premier type et chaque point de discontinuité Tt est un point où la 
fonclion de commande uw (£) est continue, tandis que le vecteur 
E (t + 0) — £ (rt — 0) est une combinaison linéaire à coefficients 
positifs d’un nombre fini de vecteurs de saut au moment tT; 

3) dans les autres points de continuité de la commande w (+), 
la fonction & ({) satisfait à l’équation des variations: 


ñn 
Li dfi(x(t), u (t 
> Î ( oi (£)) Ee. (1.4) 
Ôx 
a—=0 

On voit facilement qu'une combinaison linéaire de variations admis- 
sibles à coefficients positifs est également une variation admissible. 

Enfin, convenons d’appeler le vecteur h € R"*1 vecteur de dépla- 
cement s'il existe une telle variation admissible Ë& (£), 4 it <t, 
et un tel nombre réel 1 que 


h — E (4) + uf (x (hi), u (t)). (1.5) 


Il est évident qu’une combinaison linéaire des vecteurs de déplace- 
ment à coefficients positifs est également un vecteur de déplace- 
ment. Par conséquent, l’ensemble X, de tous les points de la forme 
x (t) + h, où h parcourt tous les vecteurs de déplacement pos- 
sibles, est un cône convexe de sommet x (£,); c’est ce cône que l’on 
appelle cône d’atteignabilité. 


440 APPENDICE 1 


On peut démontrer que X, est la coupole de l’ensemble Q, 
au point æ (4). Nous établirons l’assertion suivante plus faible, 
mais plus facile à démontrer. Si z est un point intérieur du cône K; 
relativement au plan qui le supporte, il existe un cône Q, & K, de som- 
met x (t,), supporté par le même plan, tel que ce cône est la coupole de 
l’ensemble Q, au point x (t.), le point z étant contenu dans son inté- 
rieur. 

En effet, puisque z est un point intérieur du cône X, relative- 
ment au plan qui le supporte, il existe des vecteurs linéairement 
indépendants h,, ..., h, (où s — dim X,) issus du point x (#) 
tels que le cône Q, qu’ils engendrent est contenu dans K, et con- 
tient le point z dans son intérieur. 

Le cône Q, consiste en tous les points de la forme 


y= xt) + ki +... +, ki 20, ..., k, 20. (1.6) 
Comme h,, ..., h, sont des vecteurs de déplacement, il existe 
des variations admissibles E, (f), ..., E. (t) et des nombres réels 
Li, - .., M, tels que 

h; Ë; (t) + if (x (41), U (4)), l — 1, ...) S (1.7) 
(voir (1.5)). Désignons par 
f (x (tj), Vij) — f (x (Ti); u (Ti;)), 1 . 1, +. l;, (1.8) 


tous les vecteurs de saut qui figurent dans la définition de la varia- 
tion admissible &; (£); parmi les nombres t;; certains peuvent coïn- 
cider. 

Remarquons maintenant que le vecteur hk; dépend de manière 
continue des grandeurs t%;;, j — 1, ..., l;. On peut donc 
effectuer un tel changement des moments T;; (sans changer v;; et L;), 
que tous les moments t;; seront différents deux à deux, tandis que 
les vecteurs (1.7) changeront si peu que le point z restera à l’intérieur 
du cône Q, déterminé par les nouveaux vecteurs de déplacement (1.7). 
Nous allons supposer (sans changer les notations pour 7;;, h;) qu'un 
tel changement a déjà été effectué, de sorte que tous les nombres 7;; 
diffèrent deux à deux. 

Soit o un nombre positif inférieur à chacune des distances entre 
les points 7;;, et d le plus grand des coefficients qui figurent auprès 
des vecteurs de discontinuité dans la définition des variations admis- 
sibles &, (4), ..., &, (#) (voir la condition 2 de cette définition). 
L'ensemble M constitué par tous les points de la forme (1.6), où 


k; <+: i—1,...,s, est un voisinage du point x(£,) dans le 


cône @,, et chaque point y € M se metuniquement sous la 
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forme (1.6). Pour tout point y € M désignons par u, (t) la commande 
Vij pour Ti KIT +dijk; : 
Uy () = } u (ti) pour {>4 ; (1.9) 
[u(#) pour les autres valeurs de #, 


où d;; est le coefficient qui figure dans l’expression du vecteur de 
saut (1.8) donnée dans la définition de la variation admissible Ë; (4). 

Désignons ensuite par [', le plan tangent à la variété A7, au 
point x (£,) et par x la projection orthogonale du plan F, sur la va- 
riété M, (i.e. x (x) € M, est un point tel que le vecteur x (x) — x 
est orthogonal au plan l',). L'application x est définie pour les points 
du plan [', suffisamment proches de x (£,) et s'écrit sous la forme 
x (x) = x + 0 (x — x (éo)). 

Nous supposerons que le nombre © qui figure dans la définition 
de l’ensemble 7 est tellement petit que pour tout point y € M (voir 
(1.6)) le point x (6) + KE (to) +... + RES (to) appartient au 
domaine de définition de l’application x. Désignons par x, (#) la 
trajectoire du processus (1.1) issue au moment {, du point x (x (£,)) + 
+ k1Ë Go) +... + KE, (to)) et correspondant à la commande 
(1.9). Posons maintenant 


p (y) = Ly (ta + Ab + + + + + sus), 


obtenant ainsi une application (évidemment continue) de l’ensem- 
ble M dans l’ensemble Q,. Démontrons la relation 


p (y) = y + 0 (y — x (h)), 


qui implique justement que Q, est la coupole de l’ensemble Q, au 
point x (£,). 
En effet, nous avons 


Ly (lo) = x (x (fo) + kb (to) +... + KE (£o)) = 
= & (bo) + KE (lo) +... + hs (to) +0 (HR l+...+ TE |). 


(1.10) 
Les fonctions Ë, (#), ..., £, (f) ne peuvent posséder des discon- 
tinuités qu'aux points t;;. Supposons, pour fixer les idées, que le 
plus petit des nombres t7;; est 1.:,. Les fonctions Ë, (#), ..., £, (£) 


sont continues au point 7T::, tandis que la fonction E, () possède 
une discontinuité, et l’on a 


Er (Ta +0) — Es (tu — 0) = dus (F (x (Ta), Vas) — f (x (Tu), u (tu)))- (L.11) 


Sur le demi-intervalle [,, t:) toutes les fonctions E, (#6), ... 
..., 6s(t) sont continues et satisfont aux équations des varia- 
tions (1.4), et donc k,Ë, (#) +... + RE, (#) est la solution de l’équa- 
tion (1.4) sur ce demi-interv alle. On peut alors déduire de (1.10) 
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que l’égalité suivante est satisfaite sur le demi-intervalle [£,, T,,): 


Zy (6) = ZE) + lib (©) +... 
+ kEs (0) +o (ki l+...+]k, D. (1.12) 
En particulier, 
Ly (Ta) = T (Ta) + Aka (Tu — 0) +... 
ee + AEs (Tu —0)+o(lkl+...+]k,h). (1.13) 


Considérons les variations de la fonction x, (f) auprès du moment 7;:. 
Nous avons d’après (1.9): 


Ty (Tu duks) — 2y (Tu) = dukaf (ty (6), Vas) = dunif (ty (Tr), Vas) + 
+0 (&) = dukaf (x (tu), vus) +0 (lil + + ]ks)) ; 
Z (Tai + disk) — 2 (Tia) = dushaf (x (07), u (0°) — 
= dyskf (x (Tu), u (tu)) +0 (ka) 
où 0, 0” sont certains moments intermédiaires entre t,, et Ty, + 


+ d:k,. En considérant la différence de ces expressions et en y ajou- 
tant la relation (1.13), nous obtenons (d’après (1.11)): 


Ty (Ta + dunes) = 2 (aa + danhes) + abs (Tu — 0) +... 
ces + RE (Ts) + dusks ( Cr (Tu), Vas) —f (& (tas), U (tu) + 
+o(lil+... +R) = 2x (ti + dise) + his (tu +0) + 
+ RoËo (Tas) + + HSE (Tu) + o(| ki|+ . +1k,|) = 
= 2 (Tai + dsl) + ub (tu + duks) +... + hsés (Tai + dasks) + 
+o(lAil+... + Ts). 
Cela signifie que la relation (1.12) est valable pour £ — Ty + disk. 
Mais alors (car &, (£), ..., &, (£é) est une solution de l'équation (1.4) 
entre T3, et le point suivant t;;), la relation (1.12) sera également 
satisfaite pour é > Ti + dk Jusqu'au point suivant 7;;. 
Un raisonnement tout à fait analogue est applicable au moment 


suivant tT;;, etc. Nous obtiendrons en définitive que la relation (1.12) 
reste vérifiée auprès du moment #,. En particulier, 


Ty (ti + hu +. + hs) = 2 (+ au + + Es) + 
HD ble ia + hu) of +R = 


= a (+ que. + ke) + 2 RE (4)+o(kl+... +] — 


— (41) __ (kil +... + ksus) Î (x (4), U (t:)) + >» k;Ë; (ti) + 
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+o(lkil+...+1k,)) = 2 (4)+ 2 k; (Gi (é1) +: (x (1), u (41))) + 


+o(lkil+...+{kl)=x(é) +kih +... 
..+khs+o(kil+...+tk)) 


(voir (1.7)). Ainsi, @(y)= y + o (y — x (£,)) (voir (1.6)), ce qu'il 
fallait démontrer. 

Ainsi, nous avons montré que le cône X, est « localement » une 
coupole de l’ensemble Q, au point x ({,). Désignons par X, le plan 
tangent à la variété A7,  Q, au point x (£,), et par K, le demi- 
espace déterminé dans R?*! par l'inégalité x° & x° (t,). Alors K;, 
el À, sont des cônes convexes de sommet x (£,), et ces cônes sont 
les coupoles des ensembles Q, et Q, au point x (4). Admettons que 
les cônes X,, K,, K, de sommet commun x (£,) ne possèdent pas la 
propriété de séparation. On peut alors trouver un point intérieur z 
commun à ces cônes (relativement aux plans qui les supportent) 
de manière à ce que les cônes X,, K,, K, satisfassent à la condition 
2 du théorème 32.5. Comme Q, € X, est un cône de sommet x (f,), 
supporté par le même plan que X,, et contenant le point z dans son 
intérieur, on voit (d'après le même théorème 32.5) que les cônes 
K,, Q,, K, ne possèdent également pas la propriété de séparation. 
Mais alors, suivant le théorème 35.1, il existe un point x € Q,/f 
N Q, N , différent du point x (4,), ce qui est en contradiction avec 
l’optimalité du processus w (t), x (t) considéré. Ainsi, les cônes X,, 
K,, K; possèdent la propriété de séparation. 

D'après le théorème 32.2, il existe des vecteurs &,, a, &, non 
tous nuls, dont les directions appartiennent aux cônes duaux D (K,), 
D (K;), D (K3), tels que a; + a, + as = 0. Il est évident que le 
vecteur a, possède une direction appartenant au cône D (K,) si et 
seulement si ce vecteur est orthogonal à la variété A7, au point x (£;). 
D'autre part, tout vecteur a, dont la direction appartient au cône 
D (K,) est de la forme Àe,, où À 0 et e, = (1, 0, ..., O0). Enfin, 
la direction du vecteur a, appartient au cône D (K,) si et seulement 
si (a, hk) < 0 pour tout vecteur de déplacement h. 

Ainsi, si le processus uw (t), x (t), t St &t,, est optimal, il 
existe un tel nombre À > 0 et un tel vecteur a, que le vecteur Àe, + 
+ a, = —a@ est orthogonal à la variété A7, au point x (£,), tandis 
que le vecteur a, satisfait à la condition (a, hk) < 0 pour tout vecteur 
de déplacement hk, et au moins un des vecteurs Àe,, a, est non nul. 

Il reste à transformer la condition géométrique obtenue en ex- 
pression analytique. Pour cela, considérons l’équation adjointe 
à l’équation des variations (1.4): 


p=-y EOEB Re j20,1,...,n (114) 
eu Ôx] 
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Par une dérivation évidente, on vérifie que si & (£) est une solu- 


tion (continue) de l'équation (1.4) sur un certain segment [£”, #”} 
et 1 (4) une solution de l’équation (1.14) sur le même segment, on a 


(P(@, E())= 2 a (6) E* (0) = const, 


et donc, 
(p (7), EC) = (7), ÉC)- (1.15) 
Désignons par 19 (é) la solution de (1.14) à condition initiale 
Ÿ (4) = @. (1.16) 


Cette solution est définie sur tout le segment t, < tt, où l’on 
s'était donné le processus optimal w (#), x (#). Alors le vecteur  (£,) + 
+ eo = & + Àe, est orthogonal à la variété M, au point x (4): 


Ÿ (é1) + eo L M, au point x (£,). (1.17) 


Soit maintenant £, un vecteur tangent à la variété M, au point 
x (t,). Désignons par Ë (4), 4 Lt Lt, la solution de l'équation 
(1.4) à condition initiale & (#5) — 0. La fonction E (f) sera alors 
une variation admissible (ne contenant aucun vecteur de saut) et 
donc h — E (f;) sera un vecteur de déplacement (voir (1.5)). Par 
conséquent, (a;, & (4,)) < 0. Comme —EË, sera également un vecteur 
tangent à la variété M,, nous obtenons, d’après des considérations 
analytiques, (a;,— Ë (f1)) < 0. Aïnsi, (a,,6 (£&,)) — 0. On déduit 
de (1.15) que 


( (éo); Éo) = ( (£o); E (o)) = (D (1); 8 (4)) = (au E (1)) = 0. 

Nous voyons que le vecteur 14 (4) est orthogonal à tout vecteur E, 
tangent à la variété M, au point x (4), i.e. 

% (o) L M, au point x (éo). (1.18) 

Choisissons ensuite un moment Tt qui est un point de continuité 

de la commande w (#), et un point v € U. Définissons la fonction Ë (6) 

en supposant qu’elle est nulle sur le demi-intervalle [f,, T) et satis- 

fait à l'équation (1.4) à condition initiale & (rt) — f (x (t), v) — 

— f(x (x), u (r)) sur le segment [Tt, él. Alors & (f) sera une varia- 

tion admissible (avec un seul vecteur de saut) et, par conséquent, 


h = & (£) sera un vecteur de déplacement. Donc, (a,, & (4)) < 0. 
Il découle de (1.15) que 


(D (T), f(x(T), v)—f(x(T), u(r)))=(Ÿ (Tr), Ex) — 
= (b (4), E(4)) = (as ECG) <O, 
1.e 


GT), FT), v)<(b(r), f(x (Tr), u(r)) (pour veU). (1.15) 
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Posons enfin Ë (t) = 0. Il est évident que cette fonction est une 
variation admissible, et par conséquent, k — pf (x (ft), u (4)) sera 
(pour tout u réel) un vecteur de déplacement. Donc, (a, pf (x (#), 
u (t))) 0. Comme u était quelconque, on peut en déduire (v. (1.16)) : 


(b (4), Î (x (4), u (4)) —. 0. (1.20) 
Si l’on introduit la notation 
H (b, x, u)= (4, f(x, u))= 2 Vaf” (t, u), (1.21) 


on peut écrire l'équation (1.14) sous la forme 


W= ee j=0, 1,...,n. (1.22) 

et les relations (1.19) et (1.20) de la manière suivante: 
6 Qt UTC ES (1.25) 
H (pb (4), x (), u (t)) = 0. (1.24) 


Nous obtenons ainsi le théorème suivant: 

Principe du maximum. Soitut(t), x (t), to Lt <t, 
un processus à commande continue par morceaux pour l'objet (1.1) 
satisfaisant aux inclusions x (ts) € Ms, x (t) € M. Pour l'optima- 
lité de ce processus, il est nécessaire qu’il existe un nombre À > 0 et un 
vecteur a; € R°*#1 (non nul dans le cas À — 0) tels que la solution 1 () 
de l'équation (1.22) à condition initiale 1 (t,) = a, satisfait aux con- 
ditions (1.17), (1.18), (1.23), (1.24) (où la fonction H se définit par la 
formule (1.21)). 

Considérons un cas particulier du théorème démontré. À savoir, 
supposons tout d’abord que les deuxièmes membres f (x, u) du sys- 
tème (1.1)\ ne dépendent pas de la variable 2°. Choisissons, d'autre 
part, les variétés M, et M, d’une manière spéciale. Pour cela, ad- 
mettons que certaines variétés P,, P, sont données dans l’espace R7 
des variables xl, ..., x". Désignons par M, la variété de R"*! 
composée de tous les points æ— (at, xt, .…., x") pour lesquels 


as 0 (58 LOC PS 


et par M, la variété qui est formée de tous les points x € R"*1 pour 
lesquels 


(ah 4 ve CP: 


Ainsi, M, est un cylindre de R"*t aux génératrices parallèles 
à l’axe des 2°. Sous ces hypothèses, pour le processus u (6), x (t), 
to Lt Lt qui satisfait aux conditions aux extrémités (1.2), nous 
avons 

da (t) 

— =} (x(), u(t)), x (&) =0, 
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et donc 
1 
x (4) = | P (x (6, u (6) dt. (1.25) 
to 
On peut ensuite considérer les équations (1.1) séparément pour les 
variables x!, ..., x" (car les deuxièmes membres ne dépendent pas 
de x°): 
= fi (x, Ü),_ 1=1,:.:, 1 "uCU;: (1.26) 


Enfin, les conditions (1.2) aux extrémités prennent la forme 
(x° (£o); faits ra x" (£o)) € P,, ( (ti); Ver) x (é1)) € P:. (1.27) 


Ainsi, la coordonnée x° devient tout simplement superflue et 
le problème de commande optimale se pose (dans le cas particulier 
considéré) de la manière suivante: il faut trouver, pour l’objet 
(1.26), un processus (i.e. une commande continue par mor- 
ceaux u (t) € U et une solution xt (4), . .., x" (n) du système (1.26), 
to LL) qui satisfait aux conditions (1.27) aux extrémités et 
donne en même temps la valeur minimale de la fonctionnelle (1.25). 

L’énoncé du principe du maximum dans le cas particulier con- 
sidéré se trouve également simplifié. Avant tout, remarquons que 
Ÿ,o — const d’après (1.22). Ensuite, M, étant un cylindre aux géné- 
ratrices parallèles à l’axe des x°, tout vecteur orthogonal à AZ, pos- 
sède une coordonnée nulle 2°. Par conséquent, (1.17) implique que 


Vo + À = 0, i.e. 1, — —À L O0. En outre, on déduit directement 
de (1.17) et (1.18) que 

GG), «ee Ve (6) L Ps au point (1 (4), ... 2 ()), (1.28) 
(Pr (éo)s + + +; a (fo) L PQ au point (ai (to), + . +, Zn (bo). (1.29) 


Le principe du maximum prend alors la forme suivante: 
Principe du maximum“). Soit ut), to LtLt, 
une commande continue par morceaux et (x! (t), . .., x" (t)) la trajec- 
toire correspondante pour l'objet (1.26) satisfaisant aux conditions 
aux extrémités (1.27). Pour l’optimalité de ce processus (dans le sens 
du minimum de la fonctionnelle (1.25)), il est nécessaire qu’il existe une 
solution non triviale 1 (t) du système (1.22) telle que la constante , 


*) C’est ainsi (pour le cas f0 (x, u) = 1) que le principe du maximum a été 
énoncé en 1956 par Pontriaguine sous forme d’hypothèse qui, d’ailleurs, s’atten- 
dait à ce que le principe du maximum donne une condition suffisante 
d’optimalité. La démonstration du principe du maximum (et son énoncé bien 
posé, sous forme de condition nécessaire d’optimalité) a été obtenue 
en 1958 (V. Boltianski, Principe du maximum dans la théorie des processus opti- 
maux, Doklady de l’Académie des Sciences de l’U.R.S.S., 119, n° 6, 1958, 
pp. 1070-1078. 
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est non positive et les conditions (1.23), (1.24), (1.28), (1.29) sont 
satisfaites, la fonction H étant déterminée par la formule (1.21). 

Dans les énoncés considérés ci-dessus, les moments £4,, t, n'étaient 
pas fixés d’avance ; on appelle donc de tels problèmes de commande 
oplimale problèmes à temps non fixe. Ces problèmes diffèrent des 
problèmes à temps fixe où l’on suppose que les moments £, — 0, 
ft, — T sont donnés à l’avance (sont fixés); pour le reste, la posi- 
tion du problème est la même. 

La solution du problème à temps fixe se réduit au problème à 
temps non fixe à l’aide de la méthode usuelle, que nous considé- 
rerons pour l'exemple du problème (1.25), (1.26), (1.27) en fixant 
Le 0e Te 

Introduisons une variable auxiliaire x**! et ajoutons à l’équa- 
tion (1.26) la relation 





dati 
Tr "1. (1.30) 
Désignons par P* dans l’espace R"*1 des variables x1, ..., x”, 
x" l’ensemble de tous les points qui satisfont aux conditions 
(ssl, 20, (1.31) 


D'une manière analogue, les relations 
essentiel APT (1.32) 


définissent la variété PŸ € R7*. 

Considérons le problème de commande optimale à temps non 
fixe pour l’objet (1.26), (1.30), dans le sens du minimum de la 
fonctionnelle (1.25), avec les conditions aux extrémités 


(x (bo); -.., 2" (to), 27" (bo)) EPS, (x (4), .., 27 (4), 27 (4)) € PF. 
(1.33) 


On déduit directement de (1.30)-(1.33) que #4, — t, = T, ï.e. Île 
problème considéré à temps non fixe pour l’objet (1.26), (1.30) est 
équivalent au problème à temps fixe pour l’objet (1.26). 
Par conséquent, en appliquant le théorème précédent à l’objet (1.26), 
(1.30), nous obtenons la solution du problème à temps fixe. Par 
un calcul évident, que nous omettons, on obtient le théorème suivant. 

Principe du maximum. Soit u(t), 0<t<T, une 
commande continue par morceaux, et (x! (ft), ..., x" (t)) la trajec- 
toire correspondante pour l'objet (1.26) qui satisfait aux conditions 
aux extrémités 


(x (0), ..., x (0)) € Po, (x (7), . .., æ° (T)) € P:. 


Pour l’optimalité de ce processus (dans le sens du minimum de la fonc- 
tionnelle (1.25) pour un temps fire 0 <t  T), il est nécessaire qu'il 
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existe une solution 1 (t) nontriviale du système (1.22), telle que la cons- 
tante 1, est non positive et les conditions (1.23), (1.28), (1.29) sont 
remplies (la fonction H étant donnée par la formule (1.21)). 

Remarquons que si la variété P, se réduit à un point (problème 
à extrémité gauche fixe), alors la relation (1.28) est satisfaite 
trivialement pour tout vecteur et devient, par conséquent, super- 
flue. (D'une manière analogue, si P, est un point, c’est la relation 
(1.29) qui devient superflue.) 

Si, dans le théorème précédent, la variété P, coïncide avec AR" 
(« extrémité droite libre »), alors, en vertu de (1.29), on a (y, (T), ... 

.., Yn (T)) = 0, et donc 1% 0. Ainsi, V9 << 0 et on peut sup- 

poser que Y, — —1. Par conséquent, dans le problème à temps fixe 
et à extrémité droite libre, la relation (1.29) est remplacée par la 
condition 


= 1 L(Der:r Seb (D = 
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CONDITIONS NÉCESSAIRES POUR LE PROBLÈME 
DU MINIMAX *) 


La position générale du problème du minimax (dans le cas des 
fonctions définies dans un espace euclidien de dimension finie) 
peut être énoncée de la manière suivante. On considère une famille 
{fy (&)}yea de fonctions continues dans l’espace R?; on convient 
d'appeler l’ensemble À ensemble indexant cette famille. Désignons 
par Ft (x) lemaximum des valeurs de f, (x) lorsque y parcourt 
l’ensemble À (on suppose que ce maximum existe) : 

F0 (x) = max f, (x). (2.1) 
YEA 
On pose le problème de trouver le minimum des valeurs de 
F9 (x) sur l’ensemble Z & RT. 

Dans le livre de V. Démianov et V. Malozemov **), on rencontre 
(sous certaines hypothèses naturelles concernant la famille des 
fonctions {f, (x)}) des conditions nécessaires, aussi bien que les 
conditions suffisantes, pour le problème du minimax. Celles-ci y 
sont obtenues à l’aide de la méthode de Milioutine-Doubovitski, 
qui nécessite des conditions de solidité pour les cônes des directions 
admissibles au point de minimax. Ici, en se servant de la méthode 
des coupoles, nous obtiendrons des conditions nécessaires du mini- 
max plus délicates (dans le sens qu’elles imposent des conditions 
moins restrictives sur l’ensemble ZX). 

Considérons d’abord le problème du minimax dans le cas où 
l’ensemble A est fini. À savoir, supposons que f! (x), ..., f" (x) 
sont des fonctions régulières dont le domaine de définition (pour 
chacune d'elles) contient l’ensemble ZX. Posons 

F0(x)— max f(x), (2.2) 

1SISN 
i.e. déterminons la fonction F° (x) par la formule (2.1), où À — 
— {1,..., N}, et considérons le problème de la recherche du mi- 


*) Les résultats exposés ci-dessous ont été obtenus par l’auteur en colla- 
boration avec I. Tchebotarou. 
#*) « Introduction au minimax », Editions Naouka, Moscou, 1972 (en russe). 
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nimum de la fonction (2.2) sur l’ensemble ZX. Nous supposerons en 
même temps que 


S 
S — ul Q;, (2.3) 
où Q,, ..., Q, sont certains ensembles de l’espace R*. Soit x, € X 
et supposons que Æ,, ..., K, sont les coupoles des ensembles 


Q,,..., Q, au point &. 
Théorème 1. Pour que le point x, soit un minimum de la 
jonction (2.2) sur l’ensemble ZX, il est nécessaire qu'il existe des nom- 


bres non négatifs 11, . . ., WN et des vecteurs &,, . .., a, tels que la 
direction du vecteur a; appartient au cône dual D (K;), i — 1, ...,s, 
et les conditions suivantes sont satisfaites: 

a) Si, — ...—%dy —= 0, alors au moins un des vecteurs a, ... 


., as est non nul; 


N . S 
B) à W; grad f? (xo) +2 a; =0, 


Ÿ) Ÿ; (f (to) — F° (xo)) = — 0 pour tout j — 1, N. 

Démonstration. Désignons par J (20) l'ensemble de 
tous les indices j € À pour lesquels jf? (x,) — F9 (xs) — 0. Remar- 
quons que si l’on a grad ff0 (x,) — 0 pour un certain j, € J (xo) alors 
toutes les conditions du théorème sont satisfaites, indépendamment 
de l’existence du minimum de la fonction F° (x) au point x,: il 
suffit poser Ÿ;, = 1,1%; — 0 pour j Æ jo, a; = 0 pour i = 1, 

Par conséquent, nous supposerons par la suite que l'on à a 

grad f (x0) 5 0 quel que soit j € J (x). 

Désignons par QŸ l’ensemble qui contient le point x, ainsi que 
tous les points pour lesquels f? (x) << F° (x,). On voit facilement 
que l’ensemble 


>'=an...nenetn...ne# 


est composé du point unique x,. En effet, s’il existait un point 
x, E Z* différent de x,, nous aurions x, € Z et f?(x,) << F° (x;) 
quel que soit j — 1, ..., N,i.e. F9 (x,) < F°(x,), ce qui contre- 
dit le fait que la fonction F° (x) restreinte à X atteint son minimum 
au point Zo. 

Pour j € J (xs), la coupole de l’ensemble QŸ au point x, sera 
le demi-espace KŸ consistant en tous les points x pour lesquels (x — x,, 
grad f? (xo)) 0. Mais si j E J (x), alors x, est un point intérieur 
de l’ensemble Q* et, par conséquent, la coupole de l’ensemble Q° 
au point x, sera KŸ — R". Puisque l’ensemble Z* contient le point 
unique z,, on voit, d’après le théorème 35.1, que les cônes X,, ... 

, K:, KŸ, . .., KX possèdent la propriété de séparation (remar- 
quons qu'au moins un des cônes K*, ..., K$ est un demi-espace 
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et, donc, n’est pas un plan). Par conséquent, en vertu du théorème 
32.2, il existe de tels vecteurs non tous nuls @,, . .., &@s, 01, . .., 0x 
que la direction du vecteur a; appartient au cône dual D (K;), i — 
— 1, ...,s, la direction du vecteur b; appartient au cône dual 
D (KŸ), j—=1,..., N, et l’on a la relation 


N s 
D b;j+ D ai=0. 
3=1 1=1 
Mais pour j € J (x;), nous avons D; — ; grad f° (x), où , > 0, 
et pour j € J (x,) nous avons b; — 0, i.e. on peut supposer que b; — 
= 1; grad f? (x), où 1; — 0. Aïnsi, les nombres 4,, . .., 1, et les 
vecteurs @, - .., &,; Construits satisfont aux conditions «œ), B), y). 
Le théorème est démontré. 

Avant d’énoncer un théorème plus général, introduisons de nou- 
velles notations. Soit Q” l’ensemble défini dans l’espace R" par lè 
système d'équations 


gl (x) = 0, ..., g (x) = 0, (2.4) 
et Q” l’ensemble défini par le système d’inégalités 
h\ (x) 0, ..., k1 (x) KO, (2.5) 


où toutes les fonctions gl (x), ..., gP (x), h! (x), . .., hT (x) sont 
supposées régulières. Considérons l’ensemble 


>=a'n2'nan.. ns, (2.6) 


où Q,, ..., Q, sont certains ensembles de l’espace À” et admettons 
que le domaine de définition de la fonction F° (x) (voir (2.2)) con- 
tient l’ensemble ZX. Soit x, € X ; supposons que les coupoles X,, . .. 
..., K, des ensembles Q,, . .., Q, en ce point sont données. 

Théorème 2. Pour que la fonction (2.2), restreinte à l’ensem- 
ble (2.6), atteigne son minimum au point xo, il est nécessaire qu'il 
existe des nombres 


WrZ0, 1j = 1, .:.,;N;: Ann re. ls 455 D: 
dr Lao 
et des vecteurs &@;, ..., as, dont les directions appartiennent aux 
cônes duaux D (K;), ..., D (K;), tels que les conditions suivantes 


sont satisfaites : 
œ) si tous les nombres 1p;, À;, Ôx sont nuls, alors au moins un des 


vecteurs @1, &; ne l’est pas; 


N | p 
p) Di hs grad fl (x) + 2} Am grad 8° (20) + 


q S 
+ 2 6: grad hl (x) + Ÿ &; = 0; 
I=1 i—={ 
29* 
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Ÿ) Ÿ; “a (To) — F° (To)) = 0 quel que soit j — 4, . ie 

6) ôh! (xo) = 0 quel que soit 1 — 1, ..., q. | 

Démonstration. De même que pour la démonstration 
du théorème précédent, il est aisé de voir que la condition 
grad f? (x,) — 0 pour un certain j € J (x,), ou la condition grad g” (xs) — 
— (0 pour un certain m — 1, ..., p, ou, enfin, la condition 
grad À! (x,) — 0 pour un certain Z (tel que ht (x,) — 0) impliquent les 
assertions du théorème (indépendamment de l'existence d’un mini- 
mum de la fonction Æ° (x) au point x,). Par conséquent, nous sup- 
poserons par la suite grad f? (x,) - 0 quel que soit j E J (x), 
grad g” (x,) £ 0 quel que soit m — 1, . ..,p,et, enfin, gradh!(x,) 0 
pour LE L(x,s), où L(x,) est l’ensemble de tous les indices ? -- 
= 1, ..., q pour lesquels hf (x,) = 0. 

Introduisons certaines notations. Désignons par Q;, l’hypersurface 
déterminée dans l’espace R" par l’équation g,, (x) — 0 et par Q; 
l’ensemble déterminé par l'inégalité h! (x) < 0. Alors l'hyperplan K» 
défini par l’équation (x — x,, grad g” (x,)) — 0 sera la coupole de 
l’ensemble Q;, au point x, (m—1, ..., p), et pour € L(x,), le demi- 
espace À; défini par l'inégalité (x — x,, grad h!(x,)) 0. sera la 
coupole de l’ensemble Q7 au point x,. Enfin, pour j 6 L (t), 
l’ensemble K7 — R°" sera la coupole de l’ensemble Q7 au point x,. 

En remarquant que 


D q s 
2=(n,8%)0 (A &)n CA &, 


nous voyons que l’on peut appliquer le théorème précédent à la 
fonction F° (x). Il existe donc de tels nombres 4, . . ., 1, et de tels 
vecteurs Gm, &i, &;, dont les directions appartiennent respectivement 
aux cônes duaux D (K»), D (K9), D (K;) (m—1,...,p, | — 
= 1,...,q,i—1,...,s), que l’on a les égalités 


N | p q s 
D brgrad F (&)+ 2 an+ D ait D a=0. 
5 (P (to) — F0 (x) = 0, j=1,...,N, 


dans lesquelles 1, — ... — 9x — 0 implique qu'au moins un des 
vecteurs 4», &r, a; est non nul. Pour terminer la démonstration du 
théorème, il suffit de remarquer que 


An = Àm grad g” (x) pour m—1,...,p; 
où À, - -., À Sont des nombres réels, 
ai = 6, grad h' (x) pour jEL(x), où à >0, 


et enfin a; — 0 pour lé L(xs); on peut donc supposer que, pour 
lLéL(xo), on a a; — 6, grad h! (x,), où 6 = 0 
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La condition 6) est satisfaite, puisque ht (x,) — 0 pour L € L (xo), 
et, de plus, 0, = 0 pour 6 L (x). 

Les deux théorèmes suivants se rapportent à une autre série de 
conditions nécessaires de minimax. Pour énoncer le théorème 3, 
on se sert des notations du théorème 1. 

Théorème 3. Supposons que les cônes K,1,, ..., K, ne 
possèdent pas la propriété de séparabilité dans R" (où r est un nombre 
naturel tel que r LS — 1). Pour que le point x, soit un point de mini- 
mum de la fonction F° (x) sur l’ensemble ZX, il est nécessaire qu'il existe 
des nombres non négatifs Yn1, . . ., YWn et des vecteurs 1, .- . ., @r, 
dont les directions appartiennent respectivement aux cônes duaux 
D (K;), ..., D (Ky), tels que les conditions suivantes sont satisfaites: 

&) SW =... — Vn = 0, alors au moins un des vecteurs ai, . .. 

Ar . non nul; 


B) o Ÿ; grad f? (x) + > a;, 0x) >O pour tout vecteur ôx, 


dont la Dction appartient ri cône Kr41 NN . . - () Ke; 
y) 3 ( (co) — F9 (xo)) = 0 pour tout j=1, ..., N. 
Démonstration. En appliquant le théorème 1, on voit 
qu'il existe de tels nombres %; > 0, j — 1, ..., N, et de tels 
vecteurs @, ...,@s, dont les directions appartiennent respecti- 
vement aux cônes duaux D (K,), ..., D (K,), que l’on a la con- 
dition 


N | ; 
2 ÿ; grad f? (to) + 2 a; =0 (2.7) 


et la condition y) du théorème 1, tandis que les égalités 1, — ... 
— y —= 0 impliquent qu'au moins un des vecteurs ga, .. , &s 
est non nul. Notons que, dans les conditions de notre théorème, c’est 
justement parmiles vecteurs @, . .., a, que l’on peut trouver (ie 
WW, =... Ÿn —= 0) un vecteur non nul. En effet, si a, —. 

— a, = 0, alors, d’après (2.7), on a @;+1, +. ME a; = 0, cer- 
tains des vecteurs Arts - - ., &s étant nuls. Mais alors le système 
de cônes K,:1, . .., K, possède la propriété de séparation, ce qui 
contredit l’hypothèse du théorème. La condition æ) du théorème 3 
est donc remplie. 

Démontrons enfin la condition fB). Posons 


N , Tr 
2 Ÿ; grad f? (x) 2 d:. 


De l'égalité (2.7) nous obtenons @,4, + ...+ a, — — ce. D'après 
le théorème on peut déduire que la direction du vecteur — € ap- 
partient à l'enveloppe convexe des cônes D (K,4.,), ..., D (K.), 
i.e. (vu le théorème) appartient au cône D (K,4, MN ... NN K:). 
Par conséquent, (—€, x) < 0 pour tout vecteur êx dont la direction 
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appartient au cône K,4, AN ...fN K.. Ainsi, (e, ôx) > 0, ï.e. la 
condition fB) du théorème 3 est également satisfaite. 

Avant d'énoncer le théorème suivant, introduisons certaines 
notations. Soient Q” et >” les ensembles définis dans l’espace R? 
respectivement par les systèmes d'équations 


2 (4) = 0; su xs 89 @) =-0: 

G'(x) —0,..., G'(x) = 0, 
et Q” et ©” les ensembles définis dans À" respectivement par les 
systèmes d’inégalités 

RE 0 248, ME: 

H' (x) O0, ..., HS (x) L 0. 
Supposons également que l’on se donne les ensembles Q,, .. 


.e., Q7, 21, ..., Zm de R". Admettons que le domaine de défi- 
nition de la fonction F° (x) contient l’ensemble 


>= nvnan nn nnn..n>. 


Toutes les fonctions g° (x), G° (x), h° (x), H° (x) sont supposées ré- 
gulières. Soit x, € Z ; supposons que la coupole M; de l’ensemble 
Q; au point xo (à — 1, . .., !) est donnée, ainsi que la coupole W;; 
de l’ensemble Y ; au point xs (j — 1, ..., m). Désignons par B (x) 
l’ensemble de tous les nombres B — 1, ..., s pour lesquels HP (x,)=— 
— 0. Supposons que tous les vecteurs grad G° (xs), &« = 1, ...,r; 
grad HP (xo), B € B (xo) sont non nuls. Désignons ensuite par W£ 
l'hyperplan (x — x,, grad G° (xo)) = 0, « = 1, , r, et par NS 
le demi-espace (x — x,, grad HP (x)) 0, B S 5 (x)). Supposons 
enfin Lu le système de cônes convexes N:. RPC ER EE 
BEB(xso); Y—1,..., m) ne possède pas la pro- 

Driété de séparation. 
Théorème 4. Pour que la fonction F° (x), restreinte à l’'en- 
semble Z, atteigne son minimum au point x,, il est nécessaire qu'il 


existe des nombres 1, > 0, ..., Py > 0, A4, -.., Àp, O1 > 0, 
., dy > 0 et des vecteurs &@;, . . ., &1, dont les directions appartien- 
nent respectivement aux cônes duaux D (M,), ..., D (M), tels que 


les conditions suivantes sont satisfaites : 
a) si tous les nombres 1};, À;, 0, sont nuls, alors au moins un des 


vecteurs @, . . ., @&1 ne l’est pas; 


N , D 
) (2 Ÿ; grad f? (xo) + De À grad g* (to) + 


q l 
+ D 6, grad Av (xs) + D a, ôx) > 0 
V1 1=1 
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pour tout vecteur Ôx dont la direction appartient au cône 


T m 
(n “ont n NÿyN(NY,);: 
aœ=1 BEB(x0) v=1 

ÿ) D; (to) — Et (xo)) — 0 pour tout j —1,..., N; 

Ô) Ô,h" (to) — 0 pour tout v = À, ..., q. 

Ce théorème découle directement du théorème 3 (cf. démons- 
tration du théorème 2). 

Le théorème 4 est le plus général des théorèmes considérés ici. 
Dans son énoncé, p, q,r,s,l, m peuvent être des entiers non négatifs 
quelconques. En supposant que certains d’entre eux sont nuls, nous 
obtenons toute une série de cas particuliers de ce théorème. 

Considérons enfin le problème du minimax dans le cas où l’en- 
semble À des indices (voir (2.1)) est compact, tandis que la fonc- 
tion f, (x) et ses dérivées en x° sont continues en fonction des deux 
variables x, y. Plus précisément, supposons que X à la même forme 
(2.3). Supposons ensuite que À est un espace topologique compact 
(i.e. il possède la propriété suivante: chacun de ses recouvrements 
ouverts contient un recouvrement fini; par exemple, pour À on peut 
prendre un sous-ensemble borné fermé de l’espace euclidien). Sup- 
posons que pour chaque point y € À on a une fonction régulière 
f, @&) dont le domaine de définition contient Z, les fonctions f, (x), 
0fy (x) 

x 
des variables x € Z, y € À. Définissons la fonction Æ° (x) par l’éga- 
lité (2.1). Supposons que x, € Z et K,, ..., K, sont les coupoles 
des ensembles Q,, ..., Q, au point x,. Désignons par J (xs) l’en- 
semble de tous les points y € À pour lesquels f, (x,) — F° (x). Alors 
J (x,) est un sous-ensemble compact non vide de l’espace A. Enfin, 
appelons la famille des fonctions {f,} non dégénérée au point x, 
s’il existe un tel vecteur b € R" que 


(b, grad f, (xo)) << 0 pour tout y E J (x). (2.8) 


Théorème 95. Désignons par Q, (x) l’ensemble qui contient 
le point x, et tous les points x € R" pour lesquels f,, (x) << F° (x,) quel 
que soit yE À. Ensuite, désignons par K, (xs) l’ensemble de tous les 
points x € R°" qui possèdent la propriété telle que (x—x,, gradf, (x)) 
< 0 pour tout yEJ (x;). Si la famille des fonctions {f,} est non 
dégénérée au point to, alors K5 (xo) est la coupole de l’ensemble Q, (x,) 
au point Lo. 

Démonstration. Comme l’ensemble J (x;,) est compact 
et le vecteur grad f, (x,) varie continâment en fonction de y, on 
peut déduire de (2.8) l'existence d’un tel nombre h >= 0 que 


(b, grad f, (xo)) << —h pour y E J (x;). 


\ 


(i — 1, ..., n) étant continues relativement à l’ensemble 





456 APPENDICE 2 


Il existe donc un tel r > 0 et un tel ensemble G= J (x,) ouvert 
dans À, que 


(b, grad f, (a) <—+ pour|x—x|<r, yEG. (2.9) 


Soit maintenant k un nombre naturel. Pour tout point y € J (x), 
choisissons un tel voisinage U, du point y, dans l’espace À et un 


tel voisinage Vu du point x, dans l’espace À”, que 
1 
|grad jy (2) —grad fn (| << pour VE Un & € Vi 


Les ensembles U,, yo € J (to), donnent un recouvrement ouvert 
de l’espace compact J (x,) et il existe donc un sous-ensemble fini 
{Y1, + …, Ye} € J (to), tel que 

UyiÙU + UUy, = ® (x). 
Posons 


Gx=GN (Tu: UUye), Va = Val 2 1 Vage 


Alors G; est un ensemble ouvert de À qui contient J (x,). D’après 
la construction, on peut trouver (pour tout point y € G;,) un point 


Yo € J (to) (plus précisément, un des points y, ..., ye), pour 
lequel on a 
|grad f, (x) — grad fo (| << pour 26 Vs. (2.10) 


Remarquons maintenant que l’ensemble À X G; n’a pas de 
points communs avec J (x). Par conséquent, fr (xo) << F° (x5) 
pour y E A X G,. Pour chaque point y’ € À X Gz%, choisissons un 
tel voisinage W,,, du point y’ dans l’espace À et un tel voisinage 77,, 
du point x, dans l’espace R7, que 


fu (x) < F0 (xs) pour zEHy, yEW,r. 


Les ensembles W,,, y" € À X G; donnent un recouvrement ouvert 
de l’ensemble compact À X G,; il existe donc un tel sous-ensemble 
fini {y4, ..., y} CA Gz, que 


WœU-..UW = AXGx. 
Posons 
H3=H, (50... 04. 
Alors H, est un voisinage du point x, dans À". Par construction, 
fy (x) < F° (x) pour x E Hy, yEANX G. (2.11) 
Choisissons une suite r1, ro, «+ . ., Tr, . . « décroissante et conver- 
gente vers 0 telle que r; (1 + æ) << r eten mêmetemps le r; (1 + 
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_ ]-voisinage du point x, est contenu dans Ÿ, N H,. Définissons 


ensuite, sur le segment [0, r;], la fonction à (#) de la variable réelle 
t en posant 


O pour t=0 
= + | Thet  É—TR I TR Ë 
h \EET rer Th41 TR 


Enfin, désignons le r,-voisinage du point x, dans À" par U et défi- 
nissons l'application w: U— R"* par la formule 


ba =xz+A(z— x |) b. 


L'application + est définie, en particulier, sur l’ensemble U fN] K, (x). 
Démontrons la validité des relations 


À (4) = o (6), (2.12) 
(UN Ko (to)) € Go (to); (2.13) 


qui impliquent immédiatement que X, (x) est la coupole de l’en- 
semble Q,(x,) au point x. 
La définition de la fonction À (£) nous donne: 


7 2 
À (Tr) — Erra=0, À (Tan) — 55 Tan <O, 





| pour Fr << TR 


et, par conséquent, pour tous les £ du demi-intervalle [r,4,, r;l 
(d’après la linéarité de la fonction À (£) sur cet intervalle), l’iné- 


galité à (9 — À. t< 0, i.e. 


10 + DE POUT 7zn & SÉ<Th (2.14) 


est valable. Ainsi, la relation (2.12) est satisfaite. Il reste à dé- 
montrer l'inclusion (2.13). Autrement dit, il faut montrer que 


| ZT — ZT, | << Fi, À Æ Lo, ZX € K5 (to); y € À, implique 
fu Cp (x) < F° (vo). (2.15) 


Soit Æ un nombre naturel tel que ryr, << [x — x | Lrr. Alors- 
d'après (2.14), on a 
[p PRE Pr bide tu HPtE EP ES à rs 


SRI es TR=TR (1 Fe +) 


Par conséquent, 1 (x) est situé dans ler, 1H — )-voisinage du 


point xs, et donc w (x) € V4 NN H3. Si l’on a de “re yEANX Gr, 
alors (2.11) implique 7, (p (x)) << F° (xo), ie. la relation (2.15) 
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est remplie. [1 ne reste donc qu’à considérer le cas où l’on a l’inclu- 
sion y € G,. Maïs dans ce cas on peut trouver un point y, € J (x) 
tel que l’inclusion (2.10) est satisfaite. Nous avons: 


Îy (p (x)) = Îy (to) + y (D (x)) — 
— y (to)) = y (to) + (Ÿ (x) — x, grad f, (Ë)), 
où & est un certain point du segment qui joint les points x, et 1 (x), 
de sorte que & est également situé dans le r4 (1 + æ) -voisinage du 


point x,, et donc Ë € V4, fN\ H,; en outre, Ë est situé dans le r-voisi- 
nage du point x,. Comme f, (ts) < F° (xs), nous avons 


fu (CD (x) F(xo) + (D (x) — ro, grad 7, (6)) — 
= Fo(rs) (ay grad fe (E) + A (x —20|) (6, grad j, (E)) = 
= Pr) +(i—x, grad fy (Lo)) + 
+ (er grad fn ()— grad fu (3) +R (|z— 25 |) (D, grad y (E)). 


Dans le dernier membre de cette égalité, le deuxième terme est non 
positif, car x € K, (to), tandis que les troisième et quatrième termes 
peuvent être évalués à l’aide de (2.9) et (2.10). Nous obtiendrons 
alors 


Po Gb Go) KP (+ lol à (ea De + 





De ce fait, et de l’inégalité 
2 
LG) —57n #20 POUr PR TR 


(que l’on démontre de la même manière que l'inégalité (2.14)), 
nous obtenons f, (d (x)) < F°(xo). Le théorème est démontré. 

Enonçons et démontrons maintenant (pour le cas du problème 
du minimax continu) des théorèmes analogues aux théorèmes 1-4). 
Partout par la suite nous admettrons que la famille des fonctions 
{f,} est non dégénérée au point x. 

Théorème 6. Pour que x, soit un point de minimum de la 
fonction F° (x) sur l’ensemble Z (voir (2.1), (2.3)) il est nécessaire qu'il 
existe des vecteurs Go, A, + - ., @s, dont les directions appartiennent 
respectivement aux cônes duaux D (K5 (xo), D (Ki), . .., D (Ki), 
tels que l’on a les conditions suivantes: 

&) au moins un des vecleurs @o, As + + +, As est non nul; 


B) 2% — (. 


Démonstration. Soit x, € Z un point de minimum de 
la fonction F° (x) sur X. Alors l’ensemble Z AN Q, (x) est formé 
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du seul point x,. En effet, si cet ensemble contenait le point x, x, 

alors nous aurions x, € Z et 21 € Q (to). Maïs alors on a f, (x) < 

<< F (x,) quel que soit y € À (d’après la définition de l’ensemble 

Q (to)), ie. F9 (x) = max f, (x) << F (xs), ce qui est impossible. 
À 


Ainsi, l’ensemble ZX " Q, (x) ne contient que le point x,. Re- 
marquons que, puisque le système de fonctions {f,} est non dégénéré 
au point x,, la coupole X, (x,) n’est pas un plan. D’après le théorème 
35.1, le système de cônes X, (xs), Ki, .- . ., K, possède la propriété 
de séparation, et il existe donc des vecteurs a, ..., @a., qui satis- 
font aux conditions du théorème. 

Remarque. Désignons par K, (x), yEJ(x,s) le demi- 
espace déterminé dans À” par l'inégalité (x — x,, grad f, (x,)) < 0. 
Alors 


K,(t)= N K;(x). 
YEJ(x0) 


Il est facile de démontrer que 
D (Ko ())= D N Ky(a))=conv( U  D(K, (x) 


yEJ(xo) yEJ(x0 
Par conséquent, le vecteur a, € R* appartient au cône dual D (X, (xi)) 
si et seulement s’il existe des nombres non négatifs 44, W,, . .., 4, 
et des points Yo, Yi, + - ., Un € J (xs) (qui peuvent coïncider) tels 
que 


do 2 Ÿ; grad fu, (to). 


Théorème 7. Pour que la fonction F (x), restreinte à l’en- 
semble (2.6) (cf. (2.4), (2.5)), atteigne son minimum au point xo, il 
est nécessaire qu'il existe des nombres 


TR 


el des vecteurs @o, @1, . . ., @s, dont les directions appartiennent res- 
pectivement aux cônes duaux D (K5 (xo)), D (K;), ..., D (K.) tels 
que les conditions suivantes sont satisfaites: 

&) M—=...— Àp = 0 = ...—0, — 0 implique qu'au moins. 
un des vecieurs Go, A, + + +, @S est non nul; 


D q s 
P) À, Am grad 8” (x,)+ D Grgrad ht (,)+ D a 0; 


y) ôvht (xo) = O0 pour tout l—=1,...,g. 

Ce théorème se déduit directement du théorème précédent (com- 
parer à la démonstration du théorème 2). Le théorème 6 implique: 
également le théorème suivant (dont la démonstration est analogue 
à celle du théorème 3): 
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Théorème 8. Supposons que les cônes K,+,, ..., K, (voir 
les notations du théorème 6) ne possèdent pas la propriété de séparation 
dans R" (où r est un certain nombre naturel, r < s — 1). Pour que x, 
soit un point de minimum de la fonction F9 (x) sur l’ensemble X, il 
est nécessaire qu'il existe des vecteurs Go, @y, + - +, @r, dont les direc- 
tions appartiennent respectivement aux cônes duaux K, (xo), K1, . .. 
..., X,, que l'on a les conditions suivantes: 


a) au moins un des vecteurs @o, Gr + + +, &r est non nul; 


T 
B) (D a, ôx) >0 pour tout vecteur 8x dont la direction appar- 
i=0 


tient au cône K,11 ( . . . N K4. 
En conservant les notations et les hypothèses du théorème 4, 
on peut démontrer un théorème analogue dans le cas d’un ensemble A 


compact. 

Théorème 9. Pour que la fonction F (x), restreinte à l’en- 
semble 2, atteigne son minimum au point xo, il est nécessaire qu'il 
existe des nombres 1, . .., Àp, d, > 0, ..., 0, > 0 et des vecteurs 
os A» + - -, @r, dont les directions appartiennent respectivement aux 
cônes duaux Ko(xo), Ki, - . …, Ky, tels que l'on a les conditions 
suivantes : 

4) M=... = hp = 0 =... — 04 = 0 implique qu'au moins 
un des vecteurs Gp, 1, - + +, Œ est non nul; 


p q l 
8) (3 M grad g* (to) + D 8, grad #° (x0) + D as, dx) > 0 
= V= îi—= 
pour tout vecteur x dont la direction appartient au cône 
NMNnCNn MACN M); 
œ=i BEB(x0) v=1 


y) Oh" (xs) — O0 pour tout v — 1, ..., Q. 
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